Читать книгу Искусственный интеллект. Машинное обучение онлайн

4. Визуализация результатов: Мы визуализируем результаты кластеризации, чтобы лучше понять структуру различных сегментов клиентов.

Давайте приступим к кодированию.

Для начала давайте загрузим набор данных "Mall Customer Segmentation" и изучим его структуру:

```python

import pandas as pd

# Загрузка данных

data = pd.read_csv('mall_customers.csv')

# Вывод первых нескольких строк данных для ознакомления

print(data.head())

```

После загрузки данных мы можем выполнить предварительную обработку, если это необходимо. В данном случае данные уже предобработаны и готовы к кластеризации.

Теперь давайте приступим к кластеризации. Для этого воспользуемся методом кластеризации k-средних:

```python

from sklearn.cluster import KMeans

# Инициализация модели k-средних

kmeans = KMeans(n_clusters=5, random_state=42)

# Обучение модели на данных

kmeans.fit(data)

# Получение меток кластеров для каждого клиента

labels = kmeans.labels_

```

Теперь у нас есть метки кластеров для каждого клиента. Мы можем визуализировать результаты кластеризации, чтобы лучше понять структуру различных сегментов клиентов:

```python

import matplotlib.pyplot as plt

# Визуализация кластеров

plt.scatter(data['Age'], data['Annual Income (k$)'], c=labels, cmap='viridis')

plt.xlabel('Age')

plt.ylabel('Annual Income (k$)')

plt.title('Clusters of Mall Customers')

plt.show()

```

Этот код создает график, на котором каждый клиент представлен точкой, а цвет точек указывает на принадлежность к кластеру. Таким образом, мы можем визуально оценить результаты кластеризации и выделить различные сегменты клиентов в торговом центре.


Иерархическая кластеризация

Это метод, который строит иерархию кластеров, представляющую собой древовидную структуру, называемую дендрограммой. Принцип работы этого метода заключается в постепенном объединении ближайших кластеров до тех пор, пока все объекты не окажутся в единственном кластере.

На первом шаге каждый объект представляет собой отдельный кластер. Затем на каждом последующем шаге два ближайших кластера объединяются в один. Этот процесс повторяется до тех пор, пока все объекты не соберутся в одном кластере.