В кластерном анализе считается, что:
выбранные характеристики допускают в принципе желательное разбиение на кластеры;
единицы измерения (масштаб) выбраны правильно.
Проводить кластерный анализ будем непосредственно в знакомой уже нам программе STATISTICA. В модуле Кластерный анализ реализован полный набор методов кластерного анализа данных, включая методы k-средних, иерархической кластеризации и двухвходового объединения. Данные могут поступать как в исходном виде, так и в виде матрицы расстояний между объектами. Наблюдения, переменные или и наблюдения, и переменные можно кластеризовать, используя различные меры расстояния (евклидово, квадрат евклидова, городских кварталов, Чебышева, степенное, процент несогласия и 1- коэффициент корреляции Пирсона) и различные правила объединения (связывания) кластеров (одиночная, полная связь, невзвешенное и взвешенное попарное среднее по группам, невзвешенное, взвешенное расстояние между центрами, метод Варда и другие). Матрицы расстояний можно сохранять для дальнейшего анализа в других модулях системы STATISTICA. При проведении кластерного анализа методом k-средних пользователь имеет полный контроль над начальным расположением центров кластеров. Могут быть выполнены чрезвычайно большие планы анализа: так например, при иерархическом (древовидном) связывании можно работать с матрицей из 90 тыс. расстояний. Помимо стандартных результатов кластерного анализа, в модуле доступен также разнообразный набор описательных статистик и расширенных диагностических методов (полная схема объединения с пороговыми уровнями при иерархической кластеризации, таблица дисперсионного анализа при кластеризации методом k-средних). Информация о принадлежности объектов к кластерам может быть добавлена к файлу данных и использоваться в дальнейшем анализе. Графические возможности модуля Кластерный анализ включают настраиваемые дендрограммы, двухвходовые диаграммы объединений, графическое представление схемы объединения, диаграмму средних при кластеризации по методу k-средних и многое другое.
Классификация и виды издержек
Если рынки могут обеспечивать такие хорошие
результаты, то почему же мы столь часто сталкиваемся с примерами отказа от
использования ценового механизма, когда экономическая деятельность организуется
в рамках формализованных иерархических структур и их взаимоотношений, с
использованием явного планирования и директ ...
Корреляционный анализ в статистических расчетах
Слово “статистика” приходит от латинского слова status
(состояние), которое употреблялось в значении “политическое состояние”.
Большим шагом в развитии статистической науки послужило
применение экономико-математических методов и широкое использование
компьютерной техники в анализе социально-экономических явлен ...