Вывод формулы числа сочетаний с повторениями. применение формулы
Объект исследования: формула комбинаторики для числа сочетаний с повторениями.
Результаты, полученные лично автором: рассмотрен способ построения форумы числа сочетаний с повторениями. Решены задачи, использующие данную формулу.
Сочетания с повторениями – это сочетание n объектов по k в предположении, что каждый объект может участвовать в сочетании несколько раз. Таким образом, сочетание с повторениями из n элементов по k элементов (при этом допускается, что m>n) может содержать любой элемент сколько угодно раз от 1 до k включительно или не содержать его совсем, т. е. каждое сочетание с повторениями из n элементов по k элементов может состоять не только из k различных элементов, но и k каких угодно и как угодно повторяющихся элементов.
Существует специальная формула для вычисления числа сочетаний с повторениями. Выведем эту формулу, используя пример. Пусть в кондитерском магазине продаются пирожные 4 видов: корзиночки, наполеоны, песочные и эклеры. Если куплено 3 корзиночки (к), 1 наполеон (н), 2 песочных (п) и 1 эклер (э), то получим такую запись:111|1|11|1.
В этой записи палочки отделяют одну группу пирожных от другой. Если же куплено 2 корзиночки и 5 песочных, то получим запись 11||11111|. Ясно, что разным покупкам соответствуют при этом разные комбинации из 7 единиц и 3 палочек. Обратно, каждой комбинации единиц и палочек соответствует какая-то покупка. Например, комбинации |111|1111| соответствует покупка 3 наполеонов и 4 песочных (крайние группы отсутствуют).
В результате мы получим столько единиц, сколько предметов входит в комбинацию, т. е. k, а число палочек будет на 1 меньше, чем число типов предметов, т. е. n–1. Таким образом, мы получим перестановки с повторениями из k единиц и n–1 палочек. Различным комбинациям при этом соответствуют различные перестановки с повторениями, а каждой перестановке с повторениями соответствует своя комбинация.
Итак, число сочетаний с повторениями из элементов n типов по k равно числу P(k, n–1) перестановок с повторениями из n–1 палочек и k единиц, то есть , поэтому
Рассмотрим задачу. Сколько можно построить различных прямоугольных параллелепипедов, длина каждого ребра которых является целым числом от 1 до 10? Ответ:
Материал поступил в редколлегию 24.04.2017
УДК 519.253
Е.В. Киселёва
Научный руководитель: доцент кафедры «Высшая математика»,
к.т.н. А.Г. Белоусов
Анализ качества результатов социологических
Опросов
Объект исследования: результаты социологических опросов.
Результаты, полученные лично автором: проанализированы данные реальных социологических исследований, на основе которых предложена методика выявления недостоверности результатов опросов, опирающаяся на методы теории вероятности и математической статистики.
Результаты социологических опросов, как правило, представляют собой не только информацию, но и средство влияния на принятие решений, также они могут влиять на общественное мнение. Поскольку проведение масштабных опросов требует значительных затрат, а в случае использования результатов опросов в ненаучных целях требуются данные, подтверждающие определённый тезис, в некоторых случаях публикуются фальшивые результаты опросов: действительные результаты – иные, либо опрос на самом деле не проводится.
Сфальсифицированные результаты опросов можно условно разделить на три уровня: 1) фальсификация выявляется с помощью комбинирования арифметики и методов теории вероятностей и математической статистики, 2) выявление фальсификации требует существенного опыта в сфере теории вероятностей и математической статистики, 3) соблюдение требований предыдущего уровня, а также сбор дополнительных эмпирических данных. При этом анализ, как правило, не предоставляет строгого доказательства, что результаты опроса недостоверные, но он может позволить выявить данные, являющиеся недостоверными с высокой вероятностью.
К признакам потенциально сфальсифицированных результатов опросов, по нашему мнению, относятся: общее кратное процентов голосов, круглые величины в процентах, погрешности при суммировании процентов. Рассмотрим более детально случаи «странных» результатов с использованием центральной предельной теоремы (ЦПТ) – для вопросов с выбором нескольких вариантов.
В анкетных листах нередко встречаются вопросы, где можно выбрать несколько вариантов ответа, всего не более k, при этом вариант вида «затрудняюсь ответить» не предусматривается. Любой респондент может выбрать число вариантов от 1 до k. Допустим, выбор варианта респондентом – случайная величина. Таким образом, количество процентов, набираемых всеми вариантами по всей выборке, – случайная величина, являющаяся суммой большого числа n одинаково распределённых независимых случайных величин (никакой респондент не знает, какие варианты выбирают другие респонденты), где n – размер выборки. Согласно ЦПТ распределение суммарного процента должно быть близко к нормальному. Следовательно, если суммарный процент оказался близок к 100 или 100k, это может быть вызвано наличием сфабрикованных данных, поскольку такое случайное событие маловероятно. Если в опросе есть ряд вопросов с k>1, и хотя бы 3-4 вопроса дают суммарный процент ответов, близкий к одной из границ, следует тщательно изучить данные опроса на предмет подтасовок или непреднамеренных ошибок.
Так, в нескольких найденных источниках приводятся случаи при k=3, когда суммарный процент составлял более 260, что требует дополнительных исследований на предмет причин таких показателей. Особенно важна проверка близости к верхней границе (300% для k=3). Естественно, постоянная близость суммы процентов к одному и тому же значению, включая «идеальное» 50(k+1), также должна являться аргументом для расследования.
Ещё одним примером возможного низкого качества результатов опроса может являться следующая ситуация. Так, в публикациях, касающихся опросов проводимых среди студентов вузов, насчитывающих 5-10 тыс. чел., часто фигурирует размер выборки порядка 100-200. Допустим, в некотором вузе есть 5 тыс. студентов, и по данным было опрошено 200 студентов, то есть 0,04=4% от контингента. Вероятность неучастия в опросе составит 0,96 для взятого наугад студента, для каждого последующего она медленно убывает, если все предыдущие ответили отрицательно. Если есть разнообразие по курсам и специальностям среди студентов (гарантированная случайность выборки), то для 50 человек вероятность отсутствия среди них участника опроса составит менее 13%. Уже для 60 студентов она составит менее 9%. При увеличении числа потенциальных «неучастников» с высокой долей вероятности можно утверждать, что: имел место несуществующий опрос, или репрезентативность выборки оказалась крайне низкая (например, посещено 2-3 поточных лекции, где и было отобрано 200 респондентов).
Преимущества математических методов анализа заключаются в том, что большинство из них достаточно быстры в применении и не требуют детальных данных об опросе. Кроме того, большинство из них могут быть использованы «здесь и сейчас», на основе компьютерных технологий и интернет-ресурсов.
Положительные результаты применения математических методов свидетельствуют о высокой вероятности некачественных данных, однако не гарантируют, что не имеет место случайности, или что результаты вызваны не преднамеренной подтасовкой, а ошибками при обеспечении репрезентативности данных и подсчётах результатов организаторами опроса. Вследствие этого целесообразно использовать математические методы как дополнение к нематематическим способам выявления подтасовок.
Материал поступил в редколлегию 27.04.2017
УДК 519.2
Е.В. Минаков
Научный руководитель: ассистент кафедры «Высшая математика»,
А.О. Алейникова