Фрагмент звёздного неба спроецирован на плоскость с декартовой системой координат. Учёный решил провести кластеризацию полученных точек, являющихся изображениями звёзд, то есть разбить их множество на N непересекающихся непустых подмножеств (кластеров), таких что точки каждого подмножества лежат внутри прямоугольника со сторонами длиной H и W, причём эти прямоугольники между собой не пересекаются. Стороны прямоугольников не обязательно параллельны координатным осям.
Гарантируется, что такое разбиение существует и единственно для заданных размеров прямоугольников.
Будем называть антицентром кластера точку этого кластера, сумма расстояний от которой до всех остальных точек кластера максимальна. Для каждого кластера гарантируется единственность его антицентра. Расстояние между двумя точками А (х1, y1) и B (х2, y2) на плоскости вычисляется по формуле:
В файле А хранятся координаты точек двух кластеров, где Н = 8, W = 4 для каждого кластера. В каждой строке записана информация о расположении на карте одной звезды: сначала координата х, затем координата у. Значения даны в условных единицах. Известно, что количество точек не превышает 1000.
В файле Б хранятся координаты точек трёх кластеров, где Н = 6, W = 7 для каждого кластера. Известно, что количество точек не превышает 10 000.
Структура хранения информации о звёздах в файле Б аналогична структуре в файле А.
Известно, что в файле Б имеются координаты ровно трёх «лишних» точек, представляющих аномалии, которые возникли в результате помех при передаче данных. Эти три точки не относятся ни к одному из кластеров, их учитывать не нужно.
Для файла А определите координаты центра каждого кластера, затем вычислите два числа: P1 — сумма абсциссы и ординаты центра кластера с наименьшим количеством точек, и P2 – сумма абсциссы и ординаты центра кластера с наибольшим количеством точек. Гарантируется, что во всех кластерах количество точек различно.
Для файла Б определите координаты центра каждого кластера, затем вычислите два числа: Qx — абсциссу наиболее отдалённого центра кластера от начала координат, и Qy — ординату ближайшего центра кластера к началу координат.
В ответе запишите четыре числа: в первой строке — сначала целую часть абсолютного значения произведения P1 × 10 000, затем целую часть абсолютного значения произведения P2 × 10 000; во второй строке – сначала целую часть абсолютного значения произведения Qx × 10 000, затем целую часть абсолютного значения произведения Qy × 10 000.
Возможные данные одного из файлов иллюстрированы графиком.
Ответ:
Построим диаграммы для файла А и Б. Для этого воспользуемся табличным редактором.
Диаграмма для файла А:
Диаграмма для файла Б:
Приведём решение на языке Python для файла А.
from math import *
f = open('27.txt')
claster = [[] for i in range(2)]
for s in f:
x,y= map(float, s.split())
if y < 90:
claster[0].append((x,y))
else:
claster[1].append((x,y))
def centroid(claster):
rad = []
for i in claster:
rad.append((sum(dist(i,j) for j in claster),i))
return min(rad)[1]
len_claster = sorted(claster, key = len )
centr = [centroid(i) for i in len_claster]
P1 = sum(centr[0]) *10000
P2 = sum(centr[1]) *10000
print(int(abs(P1)), int(abs(P2)))
Приведём решение на языке Python для файла В.
from math import *
f = open('27.txt')
claster = [[] for i in range(3)]
for s in f:
x,y= map(float, s.split())
if x > 16 and 32 > y > 24:
claster[0].append((x,y))
elif x > 16 and 41 > y > 33:
claster[1].append((x,y))
elif x > 16 and 50 > y > 42:
claster[2].append((x,y))
def centroid(claster):
rad = []
for i in claster:
rad.append((sum(dist(i,j) for j in claster),i))
return min(rad)[1]
centr = [centroid(i) for i in claster]
Qx = max([(dist(i, (0,0)), i) for i in centr])[1][0]
Qy = min([(dist(i, (0,0)), i) for i in centr])[1][1]
print(int(abs(Qx*10000)), int(abs(Qy*10000)))
Ответ: 1171117 1532167 222238 280837.
Приведём решение Юрия Красильникова на языке Python для файла В.
from math import dist
def clusterization(stars,radius): # кластеризация
clusters=[]
while stars:
cluster=[stars.pop()]
for c in cluster:
near=[s for s in stars if dist(c,s) < radius]
cluster+=near
for n in near: stars.remove(n)
clusters.append(cluster)
return clusters
def center(cluster): # нахождение центра кластера
sumdist=[sum([dist(star1,star2) for star1 in cluster]) for star2 in cluster]
return cluster[sumdist.index(min(sumdist))]
radius = 1 # пороговое расстояние для кластеризации
# Файл A
f=open('27_A.txt')
f.readline()
stars = [tuple(map(float,s.replace(',','.').split())) for s in f]
clusters=clusterization(stars,radius)
clusters.sort(key=lambda x: len(x))
print('кластеров:',len(clusters),'; точек:',*[len(c) for c in clusters]) # для контроля
centers=[center(c) for c in clusters]
print(*[int(sum(x)*10000) for x in centers])
# Файл B
f=open('27_B.txt')
f.readline()
stars = [tuple(map(float,s.replace(',','.').split())) for s in f]
clusters=clusterization(stars,radius)
print('кластеров:',len(clusters),'; точек:',*[len(c) for c in clusters])
clusters=[c for c in clusters if len(c)>1] # удаление кластеров из одной звезды
centers=[center(c) for c in clusters]
centers.sort(key=lambda x: dist(x,(0,0)))
print(int(centers[-1][0]*10000),int(centers[0][1]*10000))
Приведём другое решение Юрия Красильникова на языке Python для файла В.
from math import dist
def clusterization(stars,borders): # кластеризация
clusters=[[] for _ in range(len(borders))]
for s in stars:
x=[b[0] < s[0] < b[1] and b[2] < s[1] < b[3] for b in borders]
if any(x): clusters[x.index(True)].append(s)
return clusters
def center(cluster): # нахождение центра кластера
sumdist=[sum([dist(star1,star2) for star1 in cluster]) for star2 in cluster]
return cluster[sumdist.index(min(sumdist))]
# Файл A
f=open('27_A.txt')
f.readline()
stars = [tuple(map(float,s.replace(',','.').split())) for s in f]
clusters=clusterization(stars,[(10,30,90,100),(60,80,80,90)])
clusters.sort(key=lambda x: len(x))
print('кластеров:',len(clusters),'; точек:',*[len(c) for c in clusters]) # для контроля
centers=[center(c) for c in clusters]
print(*[int(sum(x)*10000) for x in centers])
# Файл B
f=open('27_B.txt')
f.readline()
stars = [tuple(map(float,s.replace(',','.').split())) for s in f]
clusters=clusterization(stars,[(10,30,20,33),(10,30,33,42),(10,30,42,51)])
print('кластеров:',len(clusters),'; точек:',*[len(c) for c in clusters])
centers=[center(c) for c in clusters]
centers.sort(key=lambda x: dist(x,(0,0)))
print(int(centers[-1][0]*10000),int(centers[0][1]*10000))

