С июня 2005 г.

Обновлено 10 ноя. 2017

Некоторые сведения и инструкции

Страница SPSS макросов Кирилла имеет приют на spsstool.net, крупнейшем ресурсе по программированию в SPSS, благодаря его создателю Рейналю Левеку (Raynald Levesque) и директору Антону Балабанову. Хотя страница является частью этого сайта, она автономна («stand-alone») и управляется ее собственным создателем, Кириллом Орловым.

Без согласия автора не публикуйте никакие из этих макросов и их документов-описаний. Применяйте же свободно. Когда сообщаете где-то о своем применении или делитесь с другими, пожалуйста не забывайте называть источник — эту страницу и автора.

Мелкие ревизии макросов могут не сопровождаться пометками об обновлении на странице или в описании. Пожалуйста, не стесняйтесь сообщать автору о найденных вами неполадках в макросах или вносить идеи и предложения. Я буду рад вашей обратной связи.

Вот коллекции макросов

Categorical-Binary recodings Icon

Categorical — Binary recodings

Перекодировка категориальных переменных в двоичные или наоборот. Собрание макросов для перевода категориальных данных в двоичные или обратно, например наборов множественного ответа – MRC (categorical multiple response set) и MRD (dichotomous multiple response set), – один тип в другой. Такая необходимость возникает очень часто при обработке опросных данных.

Multiple Response tools

Multiple Response tools

Инструменты для наборов множественного ответа. Один макрос предназначен для отладки категориального набора множественного ответа. Другой макрос снабжает двоичные наборы множественного ответа переменными «нет ответа». Еще один макрос обогащает или обедняет данными категориальный набор множественного ответа, справляясь по другим переменным с теми же вариантами ответа. Еще пара макросов создают набор множественного ответа из текстовой переменной (в нее бывает удобно набивать ответы на вопрос с множественным выбором).

KO_serutil.jpg

Series Response tools

Инструменты для серии пунктов. Собрание макросов для «простого матричного вопроса», т.е. серии переменных с общим пулом альтернативных вариантов ответа (Single response series, SRS), - например набора пунктов, каждый из которых оценен по балльной шкале или проранжирован. Один макрос предназначен для данных ранжирования и переводит переменные в категориальный набор множественного ответа или обратно. Другой макрос предназначен для более общих задач перевода значений и переменных друг в друга и для обсчета повторяющихся значений. Третий макрос предназначен для ситуации, когда респонденты оценивали не все пункты, а те только, которые они предварительно выбрали, набивка же была сделана уплотненным (ускоренным) способом.

KO_horiz.jpg

Horizontal tools

Некоторые горизонтальные операции. Собрание макросов, исполняющих некоторые нужные вещи (такие как сортировка, ранжирование или подсчет уникальных значений) внутри наблюдений, горизонтально. Входящий файл остается полностью сохранен, т.к. не применяется транспонирование.

KO_derand.jpg

Derandomize tasks

Дерандомизация заданий. Если одни и те же задания (некоторые стимулы, например анкетные вопросы, тестируемые образцы или лечебные пользования) предъявлялись разным в испытуемым в разной последовательности, так что и в файл данных оказались набиты в порядке предъявления – «порядке проб», то макрос перестроит эти данные в унифицированный «порядок заданий», при котором каждая переменная содержит данные только одного задания.

KO_weigr.jpg

Weighting groups

Взвешивание групп. Достижение нужных долевых размеров групп респондентов одномерным или многомерным (rim) взвешиванием. Можно выбрать общее N, наложить ограничение на взвешивание отдельных ячеек или наблюдений, взвесить несколько подвыборок параллельно, учесть начальные веса.

KO_catcont.jpg

Categorical into Contrast (to be added)

Категориальные переменные в контрастные. Создает из категориальных переменных контраст-переменные (3 типа на выбор) и их взаимодейственные переменные. Контраст-переменные нужны прежде всего тогда, когда нужно анализировать влияние качественных факторов методами, рассчитанными на количественные входящие (напр. линейная регрессия).

KO_prox.jpg

Various proximities

Разные меры близости. Вычисление некоторых парных мер близости или связи (сходства, расстояния, корреляции), отсутствующих в SPSS. Среди них сходство Гауэра для сравнения респондентов по количественным и качественным признакам сразу; расстояние Канберры, оптимальное для сравнения респондентов по их ответам на вопрос ранжирования, тетрахорический и бисериальный коэффициенты корреляции.

KO_mxcmpr.jpg

Matrix comparisons

Различия внутри или между матрицами. Макросы вычисляют матрицу расстояний не между переменными или наблюдениями, а между матрицами близостей, – такими, как корреляционные или дистанционные, – либо между столбцами внутри таких матриц. Эти сравнения исследователю могут помочь: например, перед кластерным или факторным анализом.

KO_covar.jpg

Fit covariates

Подгонка переменных под матрицу коэффициентов. Макросы изменяют значения переменных так, чтобы переменные имели силу связи в соответствии с указанной пользователем матрицей (корреляций, ковариаций или кросс-произведений). Опция страхования от гетероскедастичности позволяет добиться гомоскедастичных связей.

KO_cumcrvs.jpg

Cumulative curves

Кумулятивные кривые. Макросы, связанные с анализом кумулятивных распределений. Один из них сравнивает кластерным анализом подвыборки по форме кумулятивного распределения в переменных. Другой макрос – для маркетинга – анализирует данные т.н. ценовой чувствительности (price sensitivity meter, PSM).

KO_clucrit.jpg

Clustering criterions Updated.png

Кластерные критерии. Вычисление индексов, таких как Calinski–Harabasz, Davies–Bouldin, Cubic clustering criterion, Ratkowsky–Lance, C-Index, корреляция, гамма-статистика, Dunn (несколько типов), силуэт-статистика (несколько типов), AIC, BIC, помогающих выбрать лучшее классификационное разбиение, в частности решить, сколько кластеров следует выделить в кластерном анализе.

KO_eucl.jpg

Euclidean space tools

Евклидовы правки и переводы. Макросы для матриц близостей, которые должны быть уложены в евклидово или метрическое пространство. Вы можете перевести сходства (типа ковариаций/корреляций или так трактуемые) геометрически корректно в расстояния или наоборот; подправить сходства или различия, не совсем удовлетворяющие пространству, в удовлетворяющие ему.

KO_job.jpg

Job tools

Инструменты, облегчающие работу. Макросы, не связанные с конкретным анализом или обработкой, а служащие для ускорения всякого рода работ через синтаксис. Один из них является альтернативой по отношению к “SPSS Production Facility”, ускоряя производство таблиц и пр.

KO_clouds.jpg

Regular clouds

Правильные облака. Создание многомерных данных с правильной, неслучайной структурой. В частности, такие данные можно понимать как полностью бескластерные, в отличие от данных, порожденных случайно. Полезны как модельные данные при изучении особенностей тех или иных статистических алгоритмов, например кластерного анализа.

KO_gen.jpg

Generate random clusters/mixtures

Случайные кластерные/смесные данные. Создание случайных данных, состоящих из четких кластеров или смесей (нечетких кластеров). Можно сделать эти облакакруглыми или продолговатыми, гауссовыми или платикуртичными, регулировать их размеры и тесноту соприлегания. Отдельный макрос случайно поворачивает данные в пространстве.

KO_nei.jpg

Neighbourhood chains

Цепочки соседств. Из данных, показывающих парные отношения внутри набора объектов, извлекается информация о том, к какому объекту отсылает каждый данный объект «в первую очередь» или «сильнее всего». Так формируется траектория последовательных отсылок. Она показывается в виде таблицы (списка смежности) и дендрограммы.

KO_pair.jpg

Make Paired samples

Спаривание наблюдений двух выборок. Между двумя выборками или множествами делается оптимальное спаривание наблюдений, такое, что сумма внутрипарных различий минимизируется. Используется «венгерский алгоритм» сопряжения элементов от двух массивов в пары.

KO_procr.jpg

Procrustes analysis

Прокрустов анализ. Прокрустов анализ для двух конфигураций находит способ максимально совместить два облака точек в пространстве, при условии что точке одного облака заведомо назначена в соответствие точка другого. Остаточная величина несовпадения говорит об исходной степени нетождественности конфигураций. Анализ используется в задачах сравнения образов и сопоставления ординаций (к примеру матриц факторных нагрузок – для детекции одинаковых факторов).

KO_plotlat.jpg

Plot latents

Добавление латент как линий к облаку данных. Макросы показывают на диаграмме рассеяния данных их главные компоненты или дискриминанты – в виде линий, выложенных точками, значениями этих латент.

KO_imput.jpg

Impute missing data

Импутация пропущенных данных. Макросы выполняют колодное замещение (hot-deck imputation) пропущенных значений, заимствуя валидные значения у наблюдений, которые похожи на наблюдения с пропусками по неким фоновым характеристикам. Отдельный макрос выполняет произвольное, заданное пользователем заимствование значений у одних наблюдений другими наблюдениями.

KO_func.jpg

MATRIX — END MATRIX functions Updated.png

Функции для MATRIX – END MATRIX. Большое собрание полезных статистических, математических, переструктурирующих и иных функций для матричного сеанса в SPSS. Продвинутым пользователям в помощь анализу данных и написанию статистических алгоритмов.

KO_cluster.jpg

Clustering

Кластеризация. Макросы для иерархического кластерного анализа (с опциями принуждения к предсуществующей структуре, преждевременной остановки, и другими), для вычисления расстояний между уже имеющимися группами/кластерами и для приписания новых объектов к ним. Макрос для инициирования центров кластеров в методе K-средних.