Лента блогов
О конкурсах
Режем Бумажного слона №10 на части. Часть 2: Простейший анализ

Режем Бумажного слона №10 на части. Часть 2: Простейший анализ

Самородок

Безумные выходные прошли, начались не менее безумные будни, а я подготовил вам табличку с аналитикой. Точнее, две таблички - одна для любопытных (БС10), другая - для не очень (Результаты). Не очень любопытные могут пропустить то, что будет дальше, и начать читать с горизонтальной черты.

Те, кто уже смотрел прошлую табличку БС10, заметили сильные изменения. Во-первых, добавился лист с анализом, который пока не очень понятен. Во-вторых, данные сильно изменились - я перевёл их из вида, читаемого человеком, в вид, читаемый табличными формулами. В-третьих, появился ещё какой-то левый лист - это техническая информация, там ничего полезного или интересного нет.

Самая ценная часть - это анализ. С помощью большого оранжевого списка можно выбирать группу, которая будет отображаться. Под номером группы показано, сколько всего человек её оценивало. Несколько правее располагается перечень рассказов с поставленными баллами, суммой баллов по рассказу, минимальным и максимальным баллом рассказа и тремя самыми простыми и доступными способами оценки. Внизу же - графики, на которых показано распределение баллов для каждого рассказа.

Начнём с самого простого - посмотрим, что у нас по циферкам. Почти у всех рассказов минимальный балл в пределах 1-3, а максимальный - 8-10. В каком-то смысле, это можно считать подтверждением давно известной истины - почти у любого произведения найдутся как поклонники, так и ненавистники, лишь бы оно было прилично написано. Самый тепло принятый рассказ - "Исполнение желаний" (средний балл - 9,111), ему в спину дышит "Внеигровой элемент" (9,077). Самый низко оценённый рассказ - ни за что не поверите, "Катарсис" (1,333).

Но средний балл - не единственный способ определить лучший или худший рассказ. По некоторым из них есть удивительное единение мнений (не менее удивительное, чем по "Катарсису"), и увидеть это можно по минимальной и максимальной оценке. Если минимальная оценка высокая, значит, рассказ никого не оставил равнодушным и его качество достаточно высоко, чтобы даже у потенциально предвзятой аудитории не нашлось повода его притопить. Наоборот, низкая максимальная оценка говорит о невысоком качестве исполнения.

С такого ракурса, самыми любимыми рассказами становятся "В погоне за кибер-кроликом" и "Внеигровой элемент" (самый низкий балл - 7). Самый неприятный - нет, не "Катарсис", у него второе место (самый высокий балл - 5), а "Утро было, недобрым" (всего лишь 4).

С помощью графиков можно заметить, что таки да, у некоторых рассказов больше одной моды. В группе №1, стоящей по умолчанию, это "Удача им по карману" - на графике видно ярко выраженный пик на "4" с широким основанием и плато на "9-10" одной с ним высоты. Для юных аналитиков замечу, что, например, "Девочка в цилиндре" из той же группы не имеет двух пиков - это один широкий пик с дыркой в районе "7" (видимо, все критики сошлись на том, что рассказ или слишком хорош, или слишком плох для такой оценки), а, к примеру, "Исполнитель желаний" не имеет пиков вовсе - оценки разбросаны почти равномерно.

Вообще, равномерность оценок немного удручает. Я хотел добавить линию тренда на графики, но почти на всех (если не просто на всех) она выглядела, как ровная горизонтальная линия, при любых вариантах зависимостей.

Желающие побаловаться могут сейчас притормозить и поиграть с цифирками (таблицу можно сортировать, как бог на душу положит, не сломаются ни она, ни графики), а с остальными мы сейчас пройдём за тем, за чем мы и собирались.

Итак, вы открыли таблицу результатов, и, зловеще хохоча, предвкушаете, как в одном из способов оценки победитель скатывается на дно, а ваш рассказ мрачно возвышается над всеми... И обламываетесь. Но обо всём поподробней.

Таблица результатов - та же таблица анализа, только в текстовом виде, по всем группам и немного читабельней (надеюсь). В ней написано, как распределились места между рассказами при разных способах подсчёта голосов. Для повышения наглядности, первые три места по версии уважаемого Слона отмечены жёлтым, голубым и оранжевым цветом. Конечно, на БС10 не было призовых бронзовых мест, но во время споров возникла мысль, что третьи места могут очень сильно зависеть от способа оценки.

Самое главное, что можно заметить - почти везде практически при любом способе оценки лидеры не меняются, даже в очередности. Из чего следует простой вывод: нормально делай - нормально получится. Если ваш рассказ не вошёл в топ, в этом виноваты только вы, а не ужасные отдельные участники. В большинстве случаев. А если вы недовольны местом в середине группы... Впрочем, давайте по порядку, хотя нелюбопытные могут на этом и закончить.

Итак, первый, самый простой способ - вычисление среднего арифметического. Фактически, сейчас используется этот метод оценки, за исключением того, что суммарный балл не делится на количество судей. Впрочем, это необходимо лишь для сравнения рассказов из разных групп - внутри одной группы место от этого не зависит.

Самый очевидный недостаток этого метода - слабая защищённость от ошибки измерения. Если кто-то из голосовавших не удержал своих тараканов на привязи, он может поставить оценку, значительно отличающуюся от той, которую он поставил бы, обуздав свою черепную фауну. В теории, это может значительно повлиять на результат измерений. По крайней мере, инструментальной погрешности достаточно, чтобы заставить латунное ведро с магнетроном летать без топлива, а нейтрино - обгонять свет. Учитывая, что вклад в оценку одного участника составлял 7-11% (в среднем - около 8%), один необъективный участник имеет возможность (пусть и небольшую) заметно повлиять на результаты, а шансы на появление нескольких таких оценщиков в одной группе сравнительно невелики.

Чтобы решить эту проблему, ряд пользователей высказался за то, чтобы отбрасывать две крайние оценки - одну наибольшую и одну наименьшую. Это должно исключать потенциальную инструментальную ошибку. По крайней мере, так поступают в Новой судейской системе на Олимпийских играх, хотя там всего лишь девять судей (как в группе №14, бугагашенька). Глядя на удивительное разнообразие минимальных и максимальных оценок, начинаешь понимать, зачем это делают.

На практике, в большинстве случаев это ни к чему не приводит. Большая часть групп от такого нововведения не изменилась, разве что итоговый балл (но не место!) подполз немного ближе к "центру масс" оценок - на десятые доли балла. Кое-где произошли перестановки в середине группы - например, "Художник" и "Молчание сыча" в группе №9 поднялись на одно место, опустив "Отпуск за свой счёт" на два, или "Хроники лабиринта" и "Гравитации не существует" поменялись местами в группе №12. Довольно мощные телодвижения происходят в партере группы №10, где "Жмух, Марго и арахниды", лишившись одной из "единиц", упорно лезет вверх, ко второй уцелевшей "шестёрке", подминая под себя потерявших единственные "десятки" "Джиперса-Крисперса" и "Час последнего жеребца", а "Вишнёвый поцелуй", потеряв якорь в виде "кола", пытается подняться в топ-5.

Но самое интересное происходит в группах №№6, 11 и 15. В первых двух четвёртое место вырывается вперёд и занимает бронзу. В группе №6 это происходит это из-за того, что разница между третьим и четвёртым местом составляет 4 балла... и столько же составляет разница между их минимальными оценками. Максимальная оценка у них такая же, как и у подавляющего большинства рассказов - "10". Фактически, тут революция происходит бескровно - просто бронзу берёт два рассказа. Аналогична ситуация и в группе №11. Потеряв свои самые слабые оценки, эти рассказы сравнялись друг с другом.

С группой №15 ситуация немного другая, и разобраться в ней помогут графики. Как можно заметить, здесь тоже сыграла свою роль разница в минимальных баллах, благодаря чему "Время еды" вырывает пальму первенства у "Ревизора". Но, если первые два случая происходили при примерном равенстве разброса оценок у участников, то здесь всё по-другому. "Ревизор" имеет более плотный набор оценок и вообще входит в число "хороших" рассказов (т.е. не имеет оценок ниже "6"). У "Времени еды" же разброс гораздо больше, единственное преимущество перед "Ревизором" у него - большее количество "10". Потеряв кусок "левого хвоста", за счёт лишних "десяток" он обогнал своего более "собранного" оппонента.

Таким образом, можно заметить, что метод отсечения крайних не столько делает оценки объективней, сколько уменьшает их разброс. Рассказам с широким спектром мнений об их качестве это играет на руку, но тем, кто смог создать более однозначное мнение об их произведении, это, как минимум, не помогает. Опять-таки, каков шанс, что в одной группе попадётся два человека с излишне оригинальным взглядом на мир? Скажем прямо, невелик, даже в худшем случае это что-то около 1 из 100. Поэтому достаточно откидывать одно мнение, наиболее отличающееся от остальных (или, точнее, от среднего арифметического всех оценок). Так часто поступают при обработке статистических выборок. Таким образом, мы сдвигаем результаты более плохих рассказов ниже, а более хороших - выше, делая итог более контрастным. Конечно, это не поможет "Ревизору" вернуть пальму первенства группы №15, но, по крайней мере, сделает его свержение менее разгромным (хоть оно и не особо разгромным было).

Но... и в этом случае ничего принципиально не меняется, хотя есть пара интересных моментов. Рассказ Moon в группе №6 внезапно взлетает наверх, с 13-го места на 9-е. Объяснение очень простое - это двумодальный рассказ с пиками на "1" и "7". Средняя оценка находится между "4" и "5", поэтому наибольшим отклонением оказывается мода "1", уступающая после этого моде "7".

С другой стороны, откровенно графоманский "Жмух, Марго и арахниды" из группы №10 вырывается вперёд и едва не попадает в топ-5, вслед за "Вишнёвым поцелуем". Причина в довольно широком, хотя и невысоком плато, растянувшемся между "2" и "7" (с пиком в районе "3"). "Вес" этого плато вытягивает среднюю оценку вверх, из-за чего наибольшим отклонением становится "кол". "Бла-бла кар" в той же группе выигрывает бронзу у "Моего личного рая" за счёт того, что у обоих есть пики и широкое плато, но пик "Бла-бла кара" находится ближе к "10".

Таким образом, подытожим то, что мы выяснили:

1. Пишите хоть что-то читаемое, и у вас будут как ненавистники, так и поклонники

2. Пишите хорошо, и будете занимать высокие места вне зависимости от того, как считать

3. Разные системы подсчёта голосов влияют в основном на тёрки в партере группы

А в следующий раз мы проверим, подчиняется ли голосование в массе своей закону нормального распределения. Всем спасибо.

Вложение:

Скачать 24 Кбскачан 153 раза

Другие блоги автора:

← Сюжет под прицелом математики

Режем Бумажного слона №10 на части. Часть 1: Исходные данные →

Сообщить о нарушении

+18

17.09.2018 17:10

1340

Хитрый Митрий

63 комментария

Написать комментарий

Eliza Del

17.09.2018 20:17

# ↓

«Я хотел добавить линию тренда на графики, но почти на всех (если не просто на всех) она выглядела, как ровная горизонтальная линия, при любых вариантах зависимостей.»
О равномерное распределение — Все ставили оценки наугад laugh

«А в следующий раз мы проверим, подчиняется ли голосование в массе своей закону нормального распределения.» — для этого слишком мало оценок в группе, разве нет?

Ответить

Хитрый Митрий

17.09.2018 20:56

# ↑ ↓

Равномерное не равномерное (пики-то на графиках видны), но почти у всех рассказов охвачено процентов 70-80 оценочной шкалы. Учитывая сравнительно небольшую разницу на границе и в центре предполагаемого колокола, не удивительно, что тренд почти не отличается от прямой линии.
UPD. Полфазы выпало, поспать надо. В среднем 12-13 оценок, негусто, но хотя бы прикинуть можно. У двух игральных костей, конечно, в три раза больше выборка, а распределение лишь пирамидальное.

Ответить

Eliza Del

18.09.2018 08:22

# ↑ ↓

Про равномерное распределение — это была шутка.
А насчет выборки — предлагаю сделать выборку побольше: Берем рассказ (один из конкурсных) и предлагаем всем неравнодушным и не оценившим рассказ ранее поставить свою оценку, в соответствиями со своими критериями, которыми они пользовались на конкурсе.

Ответить

Хитрый Митрий

18.09.2018 08:26

# ↑ ↓

Да я понял, что шутка, но в шутке слишком много правды оказалось.
Сделать выборку побольше — идея хорошая, но тут половина судей и своё-то еле-еле дочитала, а четверть вообще решила не читать. Это ж за вредность доплачивать придётся.

Ответить

B.Slon

17.09.2018 20:31

# ↓

Впечатляющий анализ, и интересные выводы. Уверены, вы потратили на это не один час.
Огромное, искреннее спасибо!
И наконец, мы очень довольны, что дело не ограничилось простым, «а давайте введем вот такое голосование, просто потому, что мне кажется, что так будет объективнее». И есть аргументированное обоснование плюсов и минусов каждого метода.

Ответить

Хитрый Митрий

17.09.2018 20:57

# ↑ ↓

Грош цена была бы анализу, если бы там не было объяснений, почему и зачем выбирается именно такой способ.

Ответить

HEADfield

17.09.2018 20:44

# ↓

бугагашенька — вспоминая Шелдона Купера.

Очень занятный разбор. Особенно понравились цветастенькие графики, очень бодрит после рабочего дня thumbsup

Ответить

Хитрый Митрий

18.09.2018 08:35

# ↑ ↓

Я изначально ещё планировал условное форматирование результатов, чтобы можно было по цвету ячейки определить место, но по тому, как хорошо оно работало, понял, что тогда таблица будет готова к следующему году.

Ответить

Хагок

17.09.2018 20:46

# ↓

Хотелось бы уточнить: а как весь этот прекрасный анализ, который так лихо отмел личностей с «оригинальным мировосприятием», учитывает то, что у оригинальных личностей — есть оригинальные друзья… которые могли оказаться в других группах, ну… мысль, думаю, понятна… А так, конечно, шикарный труд:)

Ответить

Хитрый Митрий

17.09.2018 20:51

# ↑ ↓

Вероятность этого невелика, если заговорщиков небольшое количество, и нивелируется также, как и любое другое необоснованное отклонение. Если же дело начинает измеряться хотя бы десятком, то тут явно саботаж конкурса — а такое должно пресекаться ещё на этапе сбора работ, потом караул кричать уже поздно.

Ответить

Хагок

17.09.2018 20:55

# ↑ ↓

Я бы не был столь категоричен в суждениях, касаемо невысокой вероятности. Но, согласен, стат данных у меня нет, ведь саботажники в этом не признаются :)

Ответить

Хитрый Митрий

17.09.2018 21:06

# ↑ ↓

Ну, предположим, что у нас 15 групп и 5 заговорщиков, что уже довольно много. Вероятность того, что два заговорщика окажутся в двух соседних группах, можно оценить как 1-(1-2/15)^4 ~ 0,43. Даже не 50/50. Конечно, на пресловутые 50/50 выходят 6 заговорщиков, но это же такой надёжный план.
Впрочем, после полуночи я могу и ошибаться в оценке вероятности, если кто-то меня поправит, буду благодарен.

Ответить

Хагок

17.09.2018 21:15

# ↑ ↓

Та, не. Тут в расчет, изначально, закралась ошибка. А именно… математически, увы, просто не измерить — кто из писателей знаком, и в каких группах они окажутся, а какие группы будут судить;) Сайт не так велик численностью… все друг друга давно знают.

Ответить

Хитрый Митрий

17.09.2018 21:26

# ↑ ↓

Тогда у нас получается теория заговора, в которой какие-то таинственные обитатели этого сайта, которые уже не первый год, видимо, тут обретаются, и в каких-то тайных местах сливают авторство, чтобы постфактум объединяться в группировки по взаимопомощи. С таким в принципе невозможно бороться и, что гораздо неприятней, такое в принципе недоказуемо.
Так что подобный вариант рассматривать не вижу смысла.

Ответить

Хагок

17.09.2018 21:28

# ↑ ↓

Что ж, я об этом сразу написал… Что стат данных подобного толка у меня нет. Однако, жизненный опыт не позволяет исключать данную неизвестную. Но — я, это я smile

А анализ — это анализ

Ответить

Гость

17.09.2018 21:33

# ↑ ↓

Все проще, Ватсон! Заговора никогда и не было, потому как нафиг оно кому надо? Круто когда ты выиграл у сильного соперника. А топить заговорами… Откровенная ерунда.

Ответить

Хагок

17.09.2018 21:35

# ↑ ↓

Очевидно, именно по этому об отсутствии заговора пишет аноним;)

Ответить

Гость

17.09.2018 21:37

# ↑ ↓

А! Нас спалили!

Ответить

Гость

17.09.2018 21:38

# ↑ ↓

комрады, заметаем следы и сжигаем жесткие диски!

Ответить

Гость

17.09.2018 21:39

# ↑ ↓

Чуваки, шухер! Нашу сеть раскрыли! Валим с сайта!

Ответить

Гость

17.09.2018 21:40

# ↑ ↓

Встречаемся в условленном месте! Подключаем к следующей фазе наших кротов среди промежуточного жюри!

Ответить

Виктория

17.09.2018 21:41

# ↑ ↓

Еж, выйди из сумрака!

Ответить

Ацтек убийца

17.09.2018 22:02

# ↑ ↓

Ответить

Виктория

17.09.2018 21:06

# ↓

Ух ты!

Ответить

Хитрый Митрий

17.09.2018 21:07

# ↑ ↓

Вот это простыню я накатал, да?

Ответить

Виктория

17.09.2018 21:10

# ↑ ↓

Ну, как-то так

Ответить

Ацтек убийца

17.09.2018 22:03

# ↓

Реальный крутяк. Ещё бы системное мышление присобачить — и никто не уйдёт безнаказанным wink

Ответить

Хитрый Митрий

18.09.2018 05:05

# ↑ ↓

А уж если бы губы Никанора Ивановича да приставить к носу Ивана Кузьмича… Берите данные и присобачивайте — я собачатника для стыковки не вижу, увы.

Ответить

Ацтек убийца

18.09.2018 10:17

# ↑ ↓

Никто кроме нас! wink

Ответить

Хитрый Митрий

18.09.2018 10:19

# ↑ ↓

А как известно, «Никто кроме нас» == «Блин, опять мы»

Ответить

Ацтек убийца

18.09.2018 10:20

# ↑ ↓

Ну так сами же и напросились laugh

Ответить

Ацтек убийца

18.09.2018 10:26

# ↑ ↓

Кароче — надо технологию продавать организаторам конкурсов. Много не просить, но и за бесплатно не раздавать. Зафигачьте пост на самиздате, и вперёд! glass

Ответить

Ацтек убийца

18.09.2018 10:30

# ↑ ↓

А ещё можно предложить услуги издательствам, которые проводят конкурсы.

Ответить

ivan

17.09.2018 22:41

# ↓

Отличный труд! Это добавило конкурсу ещё один плюс. А есть эти списки рассказов по категориям? Думаю, всем было бы интересно глянуть на несколько хороших работ типа исполнителя желания или погони за киберкроликом) особенно когда уже все прекратили следить за конкурсом) и кто-то либо ждёт результатов, либо вообще уже сосредоточился на новом конкурсе)

Ответить

Хитрый Митрий

18.09.2018 05:03

# ↑ ↓

Благодарю!

А есть эти списки рассказов по категориям?

Что именно вы имеете в виду? Так-то всё, что я насобирал, лежит во вложении.

Ответить

Лев Елена

18.09.2018 06:27

# ↓

Ну Вы и статистик, батенька! wonder

Осталось подключить машинный мозг и фсё — каждому найдется его место по конкретным сусалам.
Я вообще номер своего тф с трудом вспоминаю))
Балдею от подобных анализов данных. bravo

Ответить

Хитрый Митрий

18.09.2018 06:46

# ↑ ↓

Наклепать десяток нейросетей разной степени упоротости, чтобы рассказы оценивали, и всё — готов изпитал wink

Ответить

Лев Елена

18.09.2018 08:40

# ↑ ↓

не забыть про толерантность, а то как занесет в дебри

Ответить

Хитрый Митрий

18.09.2018 08:42

# ↑ ↓

Вот с толерантностью у нейросетей плохо. Давайте лучше максимально нетолерантную, чтоб всем поровну — и чёрным, и белым, и геям, и натуралам, и веганам, и мясоедам

Ответить

Лев Елена

18.09.2018 09:14

# ↑ ↓

партийных забыл))

Ответить

Хитрый Митрий

18.09.2018 09:15

# ↑ ↓

И партийных, и беспартийных, и, самое страшное, вольнодумцев — всем вдовам по серьгам.

Ответить

Eliza Del

18.09.2018 08:41

# ↑ ↓

Не, ИИ будет голосовать только за ИИ :)

Ответить

Хитрый Митрий

18.09.2018 08:43

# ↑ ↓

У всех свои маленькие недостатки \_(%)_/

Ответить

Константин Эделев

18.09.2018 10:24

# ↓

у меня только один вопрос возник после поверхностного прочтения. Зачем?

Ответить

Хитрый Митрий

18.09.2018 10:28

# ↑ ↓

Потому что захотел, потому что мог, потому что всплыл вопрос. Срался народ на тему, что надо систему голосования менять — нате вот вам наброс, кушайте.

Ответить

Константин Эделев

18.09.2018 10:35

# ↑ ↓

В общем-то согласен. Так оно всегда работает. О любом опусе можно спросить — зачем?

Ответить

Хитрый Митрий

18.09.2018 10:36

# ↑ ↓

Ну, Power 1 — хороший вопрос, но только если кто-то кому-то что-то пытается впарить.

Ответить

Константин Эделев

18.09.2018 10:39

# ↑ ↓

Power 1?

Ответить

Хитрый Митрий

18.09.2018 10:42

# ↑ ↓

Так называется в определённых кругах вопрос «Зачем?». Как разные списки вопросов для дизайнеров вроде Power 19 для разработчиков игр.

Ответить

Ацтек убийца

18.09.2018 10:38

# ↑ ↓

Зачем?

Секретный план glass

Ответить

Хитрый Митрий

18.09.2018 10:42

# ↑ ↓

Пятилетний.

Ответить

Аня Темникова (Аня Тэ)

19.09.2018 07:40

# ↓

С «Жмухом» и «Вишнёвым поцелуем» в топ-5 вообще на больную мозоль. Как вспомню, так вздрогну…

Ответить

Хитрый Митрий

19.09.2018 07:43

# ↑ ↓

«Жмуха...» я просто не смог заставить себя дочитать, бросил на том моменте, когда появился дракон с замашками агрессивного пятиклассника. И «Вишнёвый поцелуй» тоже плох? До него руки не дошли.
UPD. Кстати, лезть-то они лезут, но не попадают. «Вишнёвый поцелуй» кое-как выползает в верхнюю половину рейтинга.

Ответить

Аня Темникова (Аня Тэ)

19.09.2018 07:47

# ↑ ↓

Нууу… Вишнёвый поцелуй — это типа кусок академки магической с кучей непонятных конфликтов на пустом месте и шаблонными героями… кому-то понравится

Ответить

Аня Темникова (Аня Тэ)

19.09.2018 07:55

# ↑ ↓

А, ну раз в топ-5 не пролезают, то я спокойна))) в табличку-то я не лезла, мне страшно от масштабов)))

Ответить

Евгения Кинер