análise de agrupamento é uma técnica estatística usada para organizar os casos em categorias para que os casos em cada categoria são semelhantes entre si e diferentes dos casos em outras categorias. Cada categoria é um cluster. Os cientistas sociais utilizam SPSS ( Statistical Package for the Social Sciences ) para realizar análises de cluster. Em K- means clustering o pesquisador designa o número de clusters desejados. K é o número de clusters pesquisadores indicam que eles querem. K- means clustering permite aos pesquisadores a se aglomerar muito grandes conjuntos de dados. Instruções
Analisar dados
1
Clique em " Analisar" no topo da tela SPSS ª . Selecione " Classifique " a partir do menu drop -down e " K-Means Cluster ".
2
Selecione uma amostra de casos . Na caixa de diálogo, clique em "Variáveis" e destacar as variáveis que você deseja usar na análise K -Means inicial. Clique sobre a seta para a esquerda para mover as variáveis na caixa. Defina o número de clusters, geralmente 5 em um conjunto de dados de tamanho médio , na caixa " Número de Clusters ". O número de clusters deve ser superior a dois e não mais do que o número de casos . Clique em " Iterate e classificar " na caixa de diálogo para obter centros de cluster. Clique em " Escrever final. "
3
Incluir todo o arquivo de dados para a análise final do K- Means. Clique sobre " Analise " na parte superior do ecrã SPSS . Selecione " Classifique " a partir do menu drop -down e " K-Means Cluster ". Na caixa de diálogo , selecione "Variáveis" e destacar as variáveis que você deseja usar. Clique sobre a seta para a esquerda . Defina o número de clusters a 5 na caixa " Número de Clusters ". Clique em " Classifique " na caixa de diálogo . Escolha "Ler inicial" para obter os centros dos grupos da amostra na Etapa 2. Clique em " Salvar". Clique em " membros de cluster. " Clique em " Continuar".
Ler a saída
4
Reveja a primeira tabela na saída, rotulado "Centros Cluster finais . " A parte superior da mesa tem os números de 1 a 5 através dele , o que indica a cada um dos cinco grupos . A coluna da esquerda lista o " REGR pontuação fator " ( pontuação fator de regressão ou o quão bem cada variável prediz o score) para cada uma das análises. Se você seguir a linha ao lado de pontuação 1 para análise 1 para a direita, ele vai te dar a pontuação fator para cada cluster.
5
Leia a próxima tabela na saída intitulada " número de casos em cada Cluster ". A caixa para a esquerda lista os aglomerados , em número , de 1 a 5 . Siga o número de cluster para a direita e você encontrará o número de casos em que cluster.
6
Olhe para a última tabela na saída, " associação de cluster ", que mostra que os casos estão em cada cluster. Os casos são listados na coluna à esquerda eo número do cluster é encontrado na coluna à extrema direita.