Некоторые тесты имеют минимальный диапазон возможных баллов. Например, в Cisco - 300-1000 баллов, а в SAT - 200-800 баллов за раздел.
С какой целью это делается? Я предполагаю, что за этим стоит какая-то статистическая логика. Может быть, мне было бы понятнее, если бы я понимал, как они вычисляют балл по заданному количеству (не)правильных вопросов.
Согласно Encyclopedia of Research Design (страница 629), это сигнал о том, что это интервальные переменные, а не переменные отношения:
Стандартизированные тесты, включая коэффициент интеллекта (IQ), схоластический тест (SAT), выпускной экзамен (GRE), вступительный экзамен в высшие учебные заведения (GMAT) и тест Миллера на аналогии (MAT), также являются примерами интервальной шкалы. Например, в шкале IQ разница между 150 и 160 баллов такая же, как между 80 и 90. Аналогично, в шкале GRE расстояние между 350 и 400 баллами такое же, как между 500 и 550.
Стандартизированные тесты не основаны на "истинном нуле", который отражает отсутствие интеллекта. У этих стандартизированных тестов даже нет нулевого балла. Самый низкий возможный балл по этим стандартизированным тестам не равен нулю. Из-за отсутствия "истинного нуля" стандартизированные тесты не могут делать заявления о соотношении баллов. Те, кто набрал 150 баллов IQ, не в два раза умнее тех, кто набрал 75 баллов IQ. Аналогично, такое соотношение не может быть применимо и к другим стандартизированным тестам, включая SAT, GRE, GMAT или MAT.
Салкинд, Нил Дж., ред. *Энциклопедия дизайна исследований. Vol. 1. Sage, 2010.
Я мог бы помочь ответить на этот из фона в психометрии. Где я работаю мы производим много тестов, все стандартизированные и затем приравнять выложить на той же шкале. Однако эти весы, от одного испытания к другому, unrelateble, если конечно в двух различных тестов приравнивая завершили исследование, чтобы определить коэффициент сдвига перевести данные из сказать тест 1 шкалы Тест 2.
Чтобы построить шкалу, мы сначала проанализируем данные тестов, так что студенту данные и пункт(вопрос) данных. Мы делаем анализ с использованием модели Раша, которая учитывает только две переменные, студенты' способности и предметы' трудности. Это позволяет построить набор данных, который содержит уровни логит студентов' способности и предметы' трудности.
Определение Логит:
в логит-это единица измерения для отчетов относительные различия между оценками способности кандидата и пункт трудности. Логитов равного интервала измерения, что означает, что расстояние между каждой точкой на шкале является равным (1-2=99-100).
После того, как таблицы логит были созданы, они могут быть использованы для создания шкалы путем применения простого линейного преобразования, такие как:
По шкале SCORE = 10 * сложность логит + 250
В работе, которую я делаю, у нас есть шкала баллов, что на самом деле ниже 0, однако большую часть работы я делаю, шкала оценки построена таким образом, что минимальная составляет около 200 или около того. Построение шкалы по большей части совершенно произвольным.
Если вы хотите увидеть, как логитов студентов и товаров рассчитывается пожалуйста, прочитайте:
Также в качестве дополнительного к сведению: есть и другие модели для ведения анализа, например оказываемых 2PL (вводится дополнительный параметр в модели Раша(1PL), элементы дискриминации), в формате 3PL (вводится дополнительный параметр оказываемых 2PL, который является угадать фактор, это создает как минимум вероятность получения элемента неправильные которого зависит ваша догадка стоимости), есть также 4PL, который добавляет дополнительный параметр(слип параметров, что потолок создает вероятность, что не 1, для получения элемента правильно).
Я надеюсь, что это помогает и обеспечивает некоторую дополнительную информацию, которая может оказаться полезной.
В дополнение к уже упомянутым причинам: потому что нам нужна более естественная шкала для ответов: иногда оценки за отдельный ответ выставляются по шкале 1-5 или 1-10, потому что это более удобно для человека, чем 0-4 или 0-9 (если только человек не программист). При сложении отдельных оценок получается ненулевое минимальное значение.
Мой учитель математики из школы говорили, что просто появляться и писать свое имя на бумаге чего-то стоит.. респект самый минимум.. таким образом, вы получаете что-то для усилия, чтобы быть там. Из данных управленческой точки зрения, оно конечно проще использовать ноль для особых случаев, таких как отсутствие или выгнали, и т. д.. как со статистической точки зрения, если бы сказал, что результаты усугубляются в окончательной ГПД, то ноль может повредить ваш средний на пессимистической стороне, и воспитатели стараются быть оптимистами о своих учениках.
Это может зависеть от теста. <ч> Тест Векслера на IQ SD15 предназначена для создания партитур, что означает 100 баллов со стандартным отклонением 15, так что около 5 процентов населения имеет показатель IQ ниже 75 баллов. Предполагая, что оценки распределены по нормальному закону, субъекты, получающие нулевую оценку будет настолько исчезающе редки (одна миллиардная процента тестируемых), что было бы невозможно гарантировать, что результаты остаются в силе до сих пор в хвостах. Также было бы очень трудно гарантировать, что эти обесцененные субъекты понимают, что/как они'вновь испытывается на всех. Сковав точное значение не имеют клиническое значение, поэтому крайне низкие оценки могут быть представлены как <20 (или сколько там). <ч> СБ использует скоринговую систему, которая наказывает случайного угадывания:
Путем выбора подходящей фракции для штрафа, вы можете гарантировать, что предполагаю, имеет нулевое математическое ожидание. Однако, если добавляется смещение, субъекты могут получать оценки ниже нуля, если они выполняют хуже, чем шанс. Эти очень низкие результаты могут быть не особо информативные, поэтому, возможно, ЕТС сообщает что-то вроде Макса(заработанных очков, шанс).
В Нидерландах большинство детей по окончании начальной школы тест ЦИТО, которая очень похожа на СБ тест, но с результатом, начиная с 501 по 550. По данным это (голландский) статья это делается, чтобы предотвратить родителей от общения с классах школы, начиная от 1 до 10, и IQ-тесты, в среднем 100.
Я полагаю, что это нижнее число для тестовых баллов и диапазон выбраны произвольно, возможно, для того, чтобы люди чувствовали себя лучше, когда они получают низкий балл, например 300-500 или там около Cisco и 200, скажем, 400 или около того для SAT, так что это сделано так по психологическим причинам и является произвольным... Я надеюсь, что это ответ на ваш вопрос, могут быть и другие возможные варианты, но я думаю, что этот выделяется как наиболее вероятный.