В чем разница между популяцией и выборкой?

Question

Дополнительно

Вопрос

В чем разница между популяцией и выборкой?

В чем разница между популяцией и выборкой? Какие общие переменные и статистические данные используются для каждой из них, и как они связаны друг с другом?

Машинное Обучение И Анализ Данных

population

variance

sample

standard-deviation

Решение / Ответ

Похожие сообщества 11

Data Science Jobs

13 228 пользователей

Лучшие вакансии по темам Data Science, машинного обучения, нейросетей, искусственного интеллекта, компьютерного зрения, сбора, обработки и анализа данных. По всем вопросам: @musit Чат: @bigdata_ru

Открыть telegram

Machine learning chat

8 969 пользователей

Please fell free to send your questions to admin - @haarrp https://t.me/pythonl - channel for Python developers https://t.me/ai_machinelearning_big_data our channel with huge amount of useful information

Открыть telegram

Machine learning

7 500 пользователей

Специализация «Машинное обучение и анализ данных» на Coursera. * FAQ (читать обязательно) – https://t.me/datasciencecourse/80206 * В чате запрещены оскорбления, мат, реклама, спам, политика * Орг. вопросы @Julia_Rom8

Открыть telegram

Data Science Chat

6 381 пользователей

Добро пожаловать в чат по Data Science, Machine Learning и AI! Реклама - @irinochka_ch Вакансии: @datasciencework

Открыть telegram

Natural Language Processing

5 655 пользователей

NLP in English @NLP_eng, NLP jobs @NLP_jobs Русскоязычный чат про NLP: QA, новости, мероприятия, вакансии. Описание — t.me/natural_language_processing/55810. Админы @dveselov, @alexkuk.

Открыть telegram

Python для анализа данных

3 350 пользователей

Чат про применение Python для анализа данных, в особенности для различного рода автоматизации и аналитики. Основной канал — @datalytx В чате вакансии просьба не размещать. Канал с вакансиями — @data_hr. Для размещения вакансии пишите @ax_makarov

Открыть telegram

Добавить вопрос

Категории

Все

Технологий

Культура / Отдых

Жизнь / Искусство

Наука

Профессии

Бизнес

Пользователи

1

Зарегистрирован 1 месяц назад

2

Артур «Апер»

Зарегистрирован 2 месяца назад

3

Viktor Malyutin

Зарегистрирован 2 месяца назад

4

Viktor Malyutin

Зарегистрирован 2 месяца назад

5

Syahputra Zhedenk

Зарегистрирован 2 месяца назад

Хотите что-то узнать? Задавайте Ваш вопрос на нашем сайте

ru.kzen.dev

Graham Cookson · Accepted Answer · 2010-07-21T14:00:03+00:00

Популяция - это совокупность изучаемых объектов. Например, средний рост мужчин. Это гипотетическая популяция, потому что она включает всех мужчин, которые жили, живут и будут жить в будущем. Мне нравится этот пример, потому что он подчеркивает, что мы, как аналитики, выбираем популяцию, которую хотим изучить. Как правило, невозможно опросить/измерить все население, потому что не все его члены поддаются наблюдению (например, мужчины, которые будут существовать в будущем). Если есть возможность перечислить все население, это часто дорого и займет много времени. В приведенном выше примере у нас есть популяция "мужчин" и интересующий нас параметр - их рост.

Вместо этого мы можем взять подмножество этой популяции, называемое выборкой, и использовать эту выборку для получения выводов об исследуемой популяции, учитывая некоторые условия. Таким образом, мы можем измерить средний рост мужчин в выборке популяции, который мы называем статистикой, и использовать его для получения выводов об интересующем нас параметре в популяции. Это умозаключение, потому что при формировании выводов о популяции на основе выборки будет присутствовать некоторая неопределенность и неточность. Это должно быть очевидно - в нашей выборке меньше членов, чем в нашей популяции, поэтому мы потеряли некоторую информацию.

Существует множество способов отбора выборки, изучение которых называется теорией выборки. Часто используемый метод называется простой случайной выборкой (SRS). В SRS каждый член популяции имеет равную вероятность быть включенным в выборку, отсюда и термин "случайная". Существует множество других методов выборки, например, стратифицированная выборка, кластерная выборка и т.д., и все они имеют свои преимущества и недостатки.

Важно помнить, что выборка, которую мы берем из популяции, является лишь одной из большого числа потенциальных выборок. Если бы десять исследователей изучали одну и ту же популяцию, взяв свои собственные выборки, то они могли бы получить разные ответы. Возвращаясь к нашему предыдущему примеру, каждый из десяти исследователей может получить разный средний рост мужчин, т.е. рассматриваемая статистика (средний рост) варьируется от выборки к выборке - она имеет распределение, называемое распределением выборки. Мы можем использовать это распределение для понимания неопределенности в нашей оценке параметра популяции.

Известно, что выборочное распределение среднего значения выборки является нормальным распределением со стандартным отклонением, равным стандартному отклонению выборки, деленному на объем выборки. Поскольку это отклонение можно легко спутать со стандартным отклонением выборки, более привычно называть стандартное отклонение выборочного распределения стандартной ошибкой.