Фрагмент звёздного неба спроецирован на плоскость с декартовой системой координат. Учёный решил провести кластеризацию полученных точек, являющихся изображениями звёзд, то есть разбить их множество на N непересекающихся непустых подмножеств (кластеров), таких, что точки каждого подмножества лежат внутри прямоугольника со сторонами длиной H и W, причём эти прямоугольники между собой не пересекаются. Стороны прямоугольников не обязательно параллельны координатным осям.
Гарантируется, что такое разбиение существует и единственно для заданных размеров прямоугольников.
Будем называть центром кластера точку этого кластера, сумма расстояний от которой до всех остальных его точек минимальна. Для каждого кластера гарантируется единственность его центра. Расстояние между двумя точками на плоскости A(x1, y1) и B(x2, y2) вычисляется по формуле:
В файле A хранятся данные о звёздах двух кластеров, где H = 6, W = 4,5 для каждого кластера. В каждой строке записана информация о расположении на карте одной звезды: сначала координата x, затем координата y. Значения даны в условных единицах. Известно, что количество звёзд не превышает 10 000.
В файле Б хранятся данные о звёздах трёх кластеров, где H = 6, W = 5 для каждого кластера. Известно, что количество звёзд не превышает 10 000.
Структура хранения информации в файле Б аналогична структуре в файле А.
Известно, что в файле Б имеются координаты ровно трёх «лишних» точек, представляющих аномалии, которые возникли в результате помех при передаче данных. Эти три точки не относятся ни к одному из кластеров, их учитывать не нужно.
Для файла А определите координаты центра каждого кластера, затем найдите два числа: Px — минимальную из абсцисс центров кластеров и Py — минимальную из ординат центров кластеров.
Для файла Б определите координаты центра каждого кластера, затем найдите два числа: Q1 — расстояние между центрами кластеров с минимальным и максимальным количеством точек и Q2 — максимальное расстояние от центра кластера до точки этого же кластера среди всех кластеров.
Гарантируется, что во всех кластерах количество точек различно.
В ответе запишите четыре числа: в первой строке — сначала целую часть абсолютной величины произведения Px × 10 000, затем целую часть абсолютной величины произведения Py × 10 000; во второй строке — сначала целую часть произведения Q1 × 10 000, затем целую часть произведения Q2 × 10 000.
Возможные данные одного из файлов проиллюстрированы графиком.
Ответ:
Построим диаграммы для файла А и Б. Для этого воспользуемся табличным редактором.
Диаграмма для файла А:
Диаграмма для файла Б:
Приведём решение на языке Python для файла А.
from math import *
f = open('DEMO_27_A.txt')
claster = [[] for i in range(2)]
for s in f:
x,y= map(float, s.split())
if y < 8:
claster[0].append((x,y))
else:
claster[1].append((x,y))
def centroid(claster):
rad = []
for i in claster:
rad.append((sum(dist(i,j) for j in claster),i))
return min(rad)[1]
centr = [centroid(i) for i in claster]
Px = min(x for x, y in centr) *10000
Py = min(y for x, y in centr) *10000
print(int(abs(Px)), int(abs(Py)))
Приведём решение на языке Python для файла В.
from math import *
f = open('DEMO_27_B.txt')
claster = [[] for i in range(3)]
for s in f:
x,y= map(float, s.split())
if 14 > x > 8 and 18 > y > 12:
claster[0].append((x,y))
elif 18 > x > 12 and 27 > y > 22:
claster[1].append((x,y))
elif 23 > x > 18 and 26 > y > 23:
claster[2].append((x,y))
def centroid(claster):
rad = []
for i in claster:
rad.append((sum(dist(i,j) for j in claster),i))
return min(rad)[1]
def max_d(claster):
return max(dist(centroid(claster),i) for i in claster)
claster_s = sorted(claster, key=len)
centr = [centroid(i) for i in claster_s]
Q1 = dist(centr[0], centr[2])
Q2 = max(max_d(i) for i in claster_s)
print(int(Q1 * 10000), int(Q2 * 10000))
Ответ:
38471 61225
142058 25299
Приведём другое решение на языке Python для файла А.
f = open('DEMO_27_A.txt')
f.readline()
ans = []
min_summ = 10**10
stars = [list(map(float, s.replace(',','.').split())) for s in f]
for i in range (len(stars) - 1):
for j in range(i+1, len (stars) - 1):
center1 = stars[i]
center2 = stars[j]
summ = 0
for star in stars:
d1 = ((star[0] - center1[0]) ** 2 + (star[1] - center1[1]) ** 2)**0.5
d2 = ((star[0] - center2[0]) ** 2 + (star[1] - center2[1]) ** 2)**0.5
summ += min(d1, d2)
if summ < min_summ:
min_summ = summ
ans = [center1, center2]
print(min(ans[0][0], ans[1][0]) * 10000, min(ans[0][1],ans[1][1]) * 10000)
Приведём решение Юрия Красильникова на языке Python.
from math import dist
def clusterization(stars,radius): # кластеризация
clusters=[]
while stars:
cluster=[stars.pop()]
for c in cluster:
near=[s for s in stars if dist(c,s) < radius]
cluster+=near
for n in near: stars.remove(n)
clusters.append(cluster)
return clusters
def center(cluster): # нахождение центра кластера
sumdist=[sum([dist(star1,star2) for star1 in cluster]) for star2 in cluster]
return cluster[sumdist.index(min(sumdist))]
def maxdist(cluster,center): # максимальное расстояние от центра кластера до звезды
return max([dist(s,center) for s in cluster])
radius = 1 # пороговое расстояние для кластеризации
# Файл A
stars = [tuple(map(float,s.replace(',','.').split())) for s in open('DEMO_27_A.txt')]
clusters=clusterization(stars,radius)
print('кластеров:',len(clusters),'; точек:',*[len(c) for c in clusters]) # для контроля
centers=[center(c) for c in clusters]
print(int(min([x[0] for x in centers])*10000),int(min([x[1] for x in centers])*10000))
# Файл B
stars = [tuple(map(float,s.replace(',','.').split())) for s in open('DEMO_27_B.txt')]
clusters=clusterization(stars,radius)
print('кластеров:',len(clusters),'; точек:',*[len(c) for c in clusters])
clusters=[c for c in clusters if len(c)>1] # удаление кластеров из одной звезды
centers=[center(c) for c in clusters]
numbers=[len(c) for c in clusters] # количества звезд в кластерах
q1=dist(centers[numbers.index(min(numbers))],centers[numbers.index(max(numbers))])
q2=max([maxdist(clusters[i],centers[i]) for i in range(len(clusters))])
print(int(q1*10000),int(q2*10000))

