THE статистика это область математики, перечисляет факты и цифры в котором есть набор методов, которые позволяют нам собирать данные и анализировать их, что позволяет выполнять их некоторую интерпретацию. Статистика разделена на две части: описательный а также логический. Описательная статистика характеризуется организацией, анализом и представлением данных, в то время как выводная статистика имеет в качестве характеристики изучение выборки данной популяции и, на ее основе, выполнение анализов и представление Игральная кость.
Читайте тоже: Какова погрешность опроса?
Принципы статистики
Далее мы увидим основные концепции и принципы статистики. На их основе можно будет определять более сложные концепции.
население или статистическая совокупность
Население или статистическая вселенная - это набор, состоящий из всех элементов которые участвуют в конкретной исследуемой теме.
Примеры статистической вселенной
а) В городе все жители принадлежат статистической вселенной.
б) На шестигранном кубике численность населения определяется количеством граней.
{1, 2, 3, 4, 5, 6}
статистические данные
Статистические данные элемент, принадлежащий к населению в целом, очевидно, что эти данные должны быть связаны с темой исследования.
Население |
статистические данные |
шестигранные кости |
4 |
Чемпионы Бразилии по маунтинбайку |
Энрике Аванчини |
Образец
Мы называем образец подмножество, сформированное на основе статистической совокупности. Выборка используется, когда совокупность очень велика или бесконечна. В случаях, когда сбор всей информации из статистической совокупности невозможен по финансовым или логистическим причинам, также необходимо использовать выборки.
Выбор выборки чрезвычайно важен для обследования, и он должен достоверно представлять совокупность. Классический пример использования выборок в опросе - это проведение демографическая перепись нашей страны.
Переменная
В статистике объектом исследования является переменная, т. Е. тема, которую намеревается изучить исследование. Например, при изучении характеристик города количество жителей может быть переменной, а также количество дождя в данный период или даже количество автобусов для перевозки общественные. Обратите внимание, что концепция переменной в статистике зависит от контекста исследования.
Организация данных в статистике происходит в фазы, как и в любом организационном процессе. Первоначально выбирается тема исследования, затем продумывается метод сбора данных исследования, и на третьем этапе проводится сбор. После завершения этого последнего шага проводится анализ того, что было собрано, и, таким образом, на основе интерпретации ищутся результаты. Теперь мы увидим некоторые важные и необходимые концепции организации данных.
Не останавливайся сейчас... После рекламы есть еще кое-что;)
роль
В случаях, когда данные могут быть представлены числами, то есть, когда переменная является количественной, список для организация этих данных. Состав может быть восходящим или нисходящим. Если переменная не является количественной, то есть качественной, невозможно использовать список, например, если данные представляют собой чувства о конкретном продукте.
Пример
В классе измеряли рост учеников в метрах. Это: 1,70; 1,60; 1,65; 1,78; 1,71; 1,73; 1,72; 1,64.
Поскольку список может быть организован по возрастанию или по убыванию, из этого следует, что:
рол: (1.60; 1,64; 1,65; 1,70; 1,71; 1,72; 1,73; 1,78}
Обратите внимание, что с уже собранным рулоном можно легче найти данные.
Таблица распределения частот
В случаях, когда в списке много элементов и много повторений данных, список становится устаревшим, так как организация этих данных неосуществима. В этих случаях таблицы и Распределение частоты они служат прекрасным организационным инструментом.
В таблице распределения абсолютная частота, мы должны указать частоту, с которой появляются данные, то есть количество раз, когда они появляются.
Построим распределительную таблицу для абсолютная частота возраст (в годах) учащихся данного класса.
Абсолютное частотное распределение | |
Возраст |
Частота (F) |
8 |
2 |
9 |
12 |
10 |
12 |
11 |
14 |
12 |
1 |
Итого (FТ) |
41 |
Из таблицы мы можем получить следующую информацию: в классе у нас 2 ученика в возрасте 8, 12 лет. 9-летние ученики и еще 12 10-летних учеников и т. Д., В сумме достигнув 41 студенты. В таблице распределения накопленные частоты, мы должны добавить частоту из предыдущей строки (в таблице абсолютного распределения частот).
Давайте построим кумулятивную таблицу распределения частот для возрастов того же класса, что и в предыдущем примере, см .:
Накопленное частотное распределение | |
Возраст |
Частота (F) |
8 |
2 |
9 |
14 |
10 |
26 |
11 |
40 |
12 |
41 |
Итого (FТ) |
41 |
В таблице распределение относительных частот, используется процент, в котором появляются все данные. Мы снова сделаем расчеты на основе таблицы абсолютного частотного распределения. Мы знаем, что 41 соответствует 100% учеников в классе, поэтому для определения процент для каждого возраста, мы просто делим частоту возраста на 41 и умножаем результат на 100, чтобы мы могли записать его в процентах.
2: 41 = 0,048 · 100 → 4,8%
12: 41 = 0,292 · 100 → 29,2%
12: 41 = 0,292 · 100 → 29,2%
14: 41 = 0,341 · 100 → 34,1%
1: 41 = 0,024 · 100 → 2,4%
Относительное частотное распределение | |
Возраст |
Частота (F) |
8 |
4,8% |
9 |
29,2% |
10 |
29,2% |
11 |
34,1% |
12 |
2,4% |
Итого (FТ) |
100% |
Читайте тоже:Применение а такжестатистика: жчастота Вабсолютный и жотносительная частота
Классы
В случаях, когда переменная непрерывна, то есть имеет несколько значений, необходимо сгруппировать их в реальные интервалы. В статистике эти интервалы называются классами..
Чтобы построить таблицу частотное распределение по классам, мы должны поместить интервалы в левый столбец с их правильным названием, а в правом столбце мы должны поставить абсолютную частоту каждого из интервалов, то есть сколько элементов принадлежит каждому из них их.
Пример
Рост учеников 3-го курса средней школы в школе.
Распределение частот по классам | |
высота (метры) |
Абсолютная частота (F) |
[1,40; 1,50[ |
1 |
[1,50; 1,60[ |
4 |
[1,60; 1,70[ |
8 |
[1,70; 1,80[ |
2 |
[1,80; 1,90[ |
1 |
Итого (FТ) |
16 |
Анализируя таблицу частотного распределения по классам, мы видим, что на третьем курсе у нас 1 ученик. который имеет рост от 1,40 до 1,50 м, так же как у нас есть 4 ученика с ростом от 1,50 до 1,60 м, и поэтому последовательно. Мы также можем наблюдать, что ученики имеют рост от 1,40 м до 1,90 м, разница между этими измерениями, то есть между самой высокой и самой низкой высотой образца, называется амплитуда.
Разница между верхней и нижней границами класса называется широта классаТаким образом, второй, в котором участвуют 4 ученика с ростом от 1,50 метра (включительно) до 1,60 метра (не включительно), имеет диапазон:
1,60 – 1,50
0,10 метра
Смотрите также: Меры дисперсии: амплитуда и отклонение
позиционные измерения
Позиционные меры используются в тех случаях, когда можно построить числовую таблицу с данными или частотной таблицей. Эти измерения показывают положение элементов по отношению к списку. Три основных показателя позиции:
В среднем
Рассмотрим список с элементами (a1, а2, а3, а4,…,нет), среднее арифметическое этих n элементов определяется как:
Пример
В танцевальной группе возраст участников был собран и представлен в следующем списке:
(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)
Определим средний возраст участников этого танцевального коллектива.
Согласно формуле, мы должны сложить все элементы и разделить этот результат на количество элементов в списке, например:
Таким образом, средний возраст участников - 22 года.
Чтобы узнать больше об этом показателе позиции, прочтите наш текст: Méутро.
медиана
Медиана задается центральным элементом списка, который имеет нечетное количество элементов. Если в списке четное количество элементов, мы должны рассмотреть два центральных элемента и вычислить среднее арифметическое между ними.
Пример
Рассмотрим следующий список.
(2, 2, 3, 3,4, 5, 6, 7, 9)
Обратите внимание, что элемент 4 делит роль на две равные части, поэтому он является центральным элементом.
Пример
Рассчитайте средний возраст танцевальной группы.
Помните, что возрастной состав танцевальной группы составляет:
(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)
Обратите внимание, что количество элементов в этом списке равно 10, поэтому разделить список на две равные части невозможно. Таким образом, мы должны взять два центральных элемента и вычислить среднее арифметическое этих значений.
См. Более подробную информацию об этой позиции в нашем тексте: Mэдиан.
Мода
Мы назовем модой элемент роли, который имеет наибольшую частоту, то есть элемент, который чаще всего проявляется в ней.
Пример
Давайте определимся с модой возрастной группы танцевальной группы.
(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)
Элемент, который появляется чаще всего, - это 21, поэтому режим равен 21.
Меры дисперсии
Меры рассеивания используется в случаях, когда среднего уже недостаточно. Например, представьте, что две машины преодолели в среднем 40 000 километров. Только зная средние значения, мы можем сказать, что каждая из двух машин прошла определяемые километры, верно?
Однако представьте, что одна из машин проехала 79000 километров, а другая 1000 километров. километров, обратите внимание, что только с информацией о среднем невозможно делать утверждения с точность.
В меры дисперсии сообщит нам, насколько элементы числового списка далеки от среднего арифметического. У нас есть два важных показателя дисперсии:
Дисперсия (σ2)
Давайте назовем среднее арифметическое квадратов разницы между каждым элементом в броске и среднее арифметическое этого броска как дисперсию. Дисперсия представлена как: σ2.
Рассмотрим список (x1, Икс2, Икс3, …, Икснет) и имеет среднее арифметическоеИкс. Разница определяется по формуле:
Стандартное отклонение (σ)
Стандартное отклонение определяется корнем дисперсии, оно говорит нам, насколько элемент разбросан по отношению к среднему значению. Стандартное отклонение обозначается σ.
Пример
Определите стандартное отклонение набора данных (4, 7, 10). Обратите внимание, что для этого необходимо сначала определить дисперсию, а для этого необходимо сначала вычислить среднее значение этих данных.
Заменив эти данные в формуле дисперсии, мы получим:
Чтобы определить стандартное отклонение, мы должны извлечь корень дисперсии.
Читать далее: Меры дисперсии: дисперсия и стандартное отклонение
Для чего нужна статистика?
Мы видели, что статистика связана с Проблемы со счетом или организацией данных. Кроме того, он играет важную роль в разработке инструментов, обеспечивающих процесс организации данных, например, в таблицах. Статистика также присутствует в различные области науки, на основе сбора и обработки данных, можно работать с математическими моделями, которые позволяют дальнейшее развитие в изучаемой области. Некоторые области, в которых статистика является фундаментальной: экономика, метеорология, маркетинг, спорт, социология и науки о Земле.
В метеорологии, например, данные собираются за определенный период, после того, как они были организованы, они обрабатываются, и поэтому на их основе строится математическая модель, позволяющая с большей степенью достоверности утверждать о климате прошлых дней. надежность. Статистика - это отрасль науки, которая позволяет нам делать утверждения с некоторой степенью надежности, но никогда со 100% уверенностью.
Статистические подразделения
Статистика разделена на две части: описательную и логическую. Первый связан с подсчетом элементов, задействованных в исследовании, эти элементы подсчитываются один за другим. В Описательная статистика, нашими основными инструментами являются меры положения, такие как среднее значение, медиана и мода, а также меры дисперсии, такие как дисперсия и стандартное отклонение, у нас также есть таблицы частот и графика.
По-прежнему в описательной статистике у нас есть очень четко определенная методология для представление данных со значительной степенью достоверности который проходит через организацию и сбор, обобщение, интерпретацию и представление и, наконец, анализ данных. Классическим примером использования описательной статистики является перепись населения (каждые 10 лет) Бразильским институтом географии и статистики (БИГС).
THE выведенный статистика, в свою очередь, он характеризуется не сбором данных от элементов популяции по отдельности, а проведением анализ выборки этой популяции, выводы о ней. При выводе статистики следует проявлять осторожность при выборе выборки, поскольку она должна очень хорошо представлять генеральную совокупность. Некоторые первоначальные результаты, такие как усреднение, в выводной статистике, называемой надеждой, выводятся на основе знаний описательной статистики.
Выводная статистика используется, например, в избирательных опросах. Выбирается образец населения таким образом, чтобы он представлял его, и, таким образом, проводится исследование. Выбирая выборку, которая не очень хорошо представляет эту популяцию, мы говорим, что исследование пристрастный и поэтому ненадежный.
решенные упражнения
Вопрос 1 - (У. Ф. Juiz de Fora - MG) Учитель физики применил тест на 100 баллов к своим 22 ученикам и получил в результате распределение оценок, показанное в следующей таблице:
40 |
20 |
10 |
20 |
70 |
60 |
90 |
80 |
30 |
50 |
50 |
70 |
50 |
20 |
50 |
50 |
10 |
40 |
30 |
20 |
60 |
60 |
– |
– |
Выполните следующие обработки данных:
а) Напишите список этих заметок.
б) Определите относительную частоту самой высокой ноты.
разрешение
а) Чтобы составить список этих заметок, мы должны записывать их в порядке возрастания или убывания. Итак, мы должны:
10, 10, 20, 20, 20, 20, 30, 30, 40, 40, 50, 50, 50, 50, 50, 60, 60, 60, 80, 90
б) Глядя на барабан, мы видим, что самая высокая нота была равна 90, а ее абсолютная частота равна 1, поскольку она появляется только один раз. Чтобы определить относительную частоту, мы должны разделить абсолютную частоту этой ноты на общую частоту, в данном случае равную 22. Таким образом:
относительная частота
Чтобы передать это число в процентах, мы должны умножить его на 100.
0,045 · 100
4,5%
Вопрос 2 - (Энем) После прокатки кубической матрицы с гранями, пронумерованными от 1 до 6, 10 раз подряд и обратите внимание на количество, полученное за каждый ход, следующая таблица распределения частоты.
Номер получен |
Частота |
1 |
4 |
2 |
1 |
4 |
2 |
5 |
2 |
6 |
1 |
Среднее значение, медиана и мода этого частотного распределения соответственно равны:
а) 3, 2 и 1
б) 3, 3 и 1
в) 3, 4 и 2
г) 5, 4 и 2
д) 6, 2 и 4
разрешение
Альтернатива Б.
Чтобы определить среднее значение, обратите внимание, что полученные числа повторяются, поэтому мы будем использовать взвешенное среднее арифметическое.
Чтобы определить медианное значение, мы должны расположить список по возрастанию или убыванию. Помните, что частота - это количество появлений лица.
1, 1, 1, 1, 2, 4, 4, 5, 5, 6
Поскольку количество элементов в списке четное, мы должны вычислить среднее арифметическое центральных элементов, которые делят список пополам, чтобы определить медианное значение, например:
Режим задается элементом, который появляется чаще всего, то есть он имеет самую высокую частоту, поэтому мы имеем, что режим равен 1.
Таким образом, среднее значение, медиана и мода соответственно равны:
3, 3 и 1
Робсон Луис
Учитель математики
В группе людей возраст: 10, 12, 15 и 17 лет. Если к группе присоединяется 16-летний подросток, что происходит со средним возрастом группы?
Рассчитайте среднюю зарплату для этой компании.