Фрагмент звёздного неба спроецирован на плоскость с декартовой системой координат. Учёный решил провести кластеризацию полученных точек, являющихся изображениями звёзд, то есть разбить их множество на N непересекающихся непустых подмножеств (кластеров) так, что они будут лежать внутри сектора окружности радиуса R = 50 с центральным углом 20°.
Гарантируется, что такое разбиение существует и единственно.
Будем называть центром кластера точку этого кластера, сумма расстояний от которой до всех остальных точек кластера минимальна. Для каждого кластера гарантируется единственность его центра. Расстояние между двумя точками на плоскости A(x1; y1) и B(x2; y2) вычисляется по формуле:
В файле А хранятся данные о звёздах трёх кластеров, для которых центром окружности является точка C(5, –9). В каждой строке записана информация о расположении на карте одной звезды: сначала координата х, затем координата у. Значения даны в условных единицах. Известно, что количество звёзд не превышает 1000.
В файле Б хранятся данные о звёздах шести кластеров, для которых центром окружности является точка C(–10, –7). Известно, что количество звёзд не превышает 10 000. Структура хранения информации о звёздах в файле Б аналогична файлу А.
Для каждого файла определите координаты центра каждого кластера, затем вычислите два числа: Pх — среднее арифметическое абсцисс центров кластеров, и Py — среднее арифметическое ординат центров кластеров.
В ответе запишите четыре числа: в первой строке сначала целую часть произведения |Pх| × 10 000, затем целую часть произведения |Py| × 10 000 для файла А, во второй строке — аналогичные данные для файла Б. Возможные данные одного из файлов иллюстрированы графиком.
Внимание! График приведён в иллюстративных целях для произвольных значений, не имеющий отношения к заданию. Для выполнения задания используйте данные из прилагаемых файлов.
Ответ:
Построим диаграммы для файла А и Б. Для этого воспользуемся табличным редактором.
Диаграмма для файла А:
Диаграмма для файла Б:
Приведём решение на языке Python для файла А.
import math
f = open('27.txt')
claster = [[] for i in range(3)]
for s in f:
x,y = [float(c) for c in s.split()]
if y < -7:
claster[0].append ([x,y])
elif 34 > x > 11 and 11 > y > -5:
claster[1].append ([x,y])
else:
claster[2].append ([x,y])
def cent(cl):
rad = []
for i in cl:
rad.append((sum(math.dist(i,j) for j in cl),i))
return min(rad)[1]
center = [cent(i) for i in claster]
x = abs(sum(x for x, y in center)/3*10000)
y = abs(sum(y for x, y in center)/3*10000)
print(int(x),int(y))
Приведём решение на языке Python для файла B.
import math
f = open('27.txt')
claster = [[] for i in range(6)]
for s in f:
x,y = [float(c) for c in s.split()]
if y < -5:
claster[0].append ([x,y])
elif y < x + 1:
claster[1].append ([x,y])
elif y < 2*x + 11:
claster[2].append ([x,y])
elif y < 13*x + 120:
claster[3].append ([x,y])
elif y > -2.5*x - 30:
claster[4].append ([x,y])
else:
claster[5].append ([x,y])
def cent(cl):
rad = []
for i in cl:
rad.append((sum(math.dist(i,j) for j in cl),i))
return min(rad)[1]
center = [cent(i) for i in claster]
x = abs(sum(x for x, y in center)/6*10000)
y = abs(sum(y for x, y in center)/6*10000)
print(int(x),int(y))
Ответ: 178755; 2896; 37392; 50998.
Приведём решение Юрия Красильникова на языке Python.
from math import dist,degrees,atan2
def clusterization(stars,borders,point): # кластеризация
clusters=[[] for _ in range(len(borders)-1)]
for s in stars:
angle=degrees(atan2(s[1]-point[1],s[0]-point[0]))
x=[borders[i] < angle < borders[i+1] for i in range(len(borders)-1)]
if any(x): clusters[x.index(True)].append(s)
return clusters
def center(cluster): # нахождение центра кластера
sumdist=[sum([dist(star1,star2) for star1 in cluster]) for star2 in cluster]
return cluster[sumdist.index(min(sumdist))]
# Файл A
stars = [tuple(map(float,s.replace(',','.').split())) for s in open('271.txt')]
clusters=clusterization(stars,[-10,20,50,80],(5,-9))
print('кластеров:',len(clusters),'; точек:',*[len(c) for c in clusters]) # для контроля
centers=[center(c) for c in clusters]
print(*[int(abs(sum(x[i] for x in centers)/len(centers)*10000)) for i in range(2)])
# Файл B
stars = [tuple(map(float,s.replace(',','.').split())) for s in open('272.txt')]
clusters=clusterization(stars,[-30,0,30,60,90,120,150],(-10,-5))
print('кластеров:',len(clusters),'; точек:',*[len(c) for c in clusters]) # для контроля
centers=[center(c) for c in clusters]
print(*[int(abs(sum(x[i] for x in centers)/len(centers)*10000)) for i in range(2)])

