Брацки Фермы — различия между версиями

Материал из Брацка Правки
Перейти к: навигация, поиск
(Задачи)
(Архитектура)
Строка 40: Строка 40:
  
 
==Архитектура==
 
==Архитектура==
Требования к архитектуре:
+
===Требования к архитектуре===
 
#отказоустойчивость и высокая доступность основных приложений. На данный момент, [[Брацка Правка|Брацкой Правки]], [[Брацка Учебка|Брацкой Учебки]], [[Брацка Сетка|Брацкой Сетки]].
 
#отказоустойчивость и высокая доступность основных приложений. На данный момент, [[Брацка Правка|Брацкой Правки]], [[Брацка Учебка|Брацкой Учебки]], [[Брацка Сетка|Брацкой Сетки]].
 
#минимальная стоимость.
 
#минимальная стоимость.
 
#максимально-возможноe разнообразиe в рамках требования по минимальной стоимости.
 
#максимально-возможноe разнообразиe в рамках требования по минимальной стоимости.
  
 +
Создание инфраструктуры должно происходить как можно быстрее и с наименьшими затратами, временно, возможно, в ущерб качеству. Подразумевается, что качество будет достигнуто в результате доработки жизнеспособных прототипов.
 +
 +
При том, что отказоустойчивость на является глобальным требованием ко всем частям инфраструктуры, любая часть жизнеспособного прототипа инфраструктуры должна быть:<ol type="a"><li>наблюдаемым средствами мониторинга,</li><li>восстанавливаемым в случае проблем,</li><li>связанным воедино, в частности, средствами SSO, и</li><li>обеспечивающим CDN и Geocast для основных приложений.</li></ol>
 +
 +
===Идеи===
 
Предварительные идеи по архитектуре таковы:
 
Предварительные идеи по архитектуре таковы:
 
#Один железный сервер с относительно небольшой производительностью и относительно большим объёмом диска будет служить платформой для [[Опытно Облако|Опытна Облака]]. Eго виртуализация поддержит эксперименты при том, что отказоустойчивость для них не принципиальна.
 
#Один железный сервер с относительно небольшой производительностью и относительно большим объёмом диска будет служить платформой для [[Опытно Облако|Опытна Облака]]. Eго виртуализация поддержит эксперименты при том, что отказоустойчивость для них не принципиальна.
 
#Один- два отказоустойчивых кластера или отказоустойчивый кластер и небольшое облако для основных приложений.
 
#Один- два отказоустойчивых кластера или отказоустойчивый кластер и небольшое облако для основных приложений.
#Несколько VPS в разных частях света, идельно, поддерживаемых CDN и с базами, завязанными в кластеры. Теоретически, их отказоустойчивость может достигаться отказоустойчивостью баз.
+
#Несколько VPS в разных частях света, идельно, поддерживаемых CDN и с базами, завязанными в кластеры. Теоретически, их отказоустойчивость может достигаться либо отказоустойчивостью баз, либо дополнительными услугами хостеров типа Floating IP у [[DigitalOcean]].
 
#Общественное облако, особенно, для [[Брацка Вебка|Брацкой Вебки]] и, возможно, [[Брацки Жици|Брацкиx Жиц]].
 
#Общественное облако, особенно, для [[Брацка Вебка|Брацкой Вебки]] и, возможно, [[Брацки Жици|Брацкиx Жиц]].
  

Версия 17:31, 2 июня 2022

Брацки Фермы (здесь и далее по тексту -- Фермы) -- это инфраструктура Брацка Облака (здесь и далее по тексту -- Облака). Архитектура облачной инфраструктуры не определена. Скорее всего, когда работа Школы войдёт в привычный режим, инфраструктура должна состоять из некой комбинации частного и общественных облаков.


Содержание

Цели и задачи

Цели

Целью разработки является создание инфраструктур:

  1. Основных пользовательских приложений, которые должны быть высоко доступны.
  2. Курсовых и эксперементальных приложений, для которых требование отказоустойчивости не принципиально.
  3. Оплётa как системы услуг федерации.

Задачи

  1. До определения и реализации новой архитектуры, поддерживать те технологические ресурсы, которые имеются в наличии, а также развивать их документацию -- общую на Правке и детальную на Крынке.
  2. Исследовать существующие и существовавшие Инциденты с сетью, Инциденты с портами, Инциденты атак и найти пути устранения проблем.
  3. Создать архитектуру Ферм и задокументировать её на вики-страницах, связанных с этой страницей.
  4. Разбить проект на несколько разработок в секции Перечень проектов.
  5. Под каждую разработку определить ответственного координатора, который или которая далее сформирует список консультантов и разработчиков, а также организует сообщество на Сетке и периодические видеоконференции, на которые будут приглашаться все заинтересованные в разработке. С одним из разработчиков должен быть заключён контракт на разработку. Как минимум с одним из консультантов должен быть заключён контракт на консультации и/или участие в видеоконференциях.

Поиск ответственных

Объявление

Сетевой администратор (ProxmoxVE)

Для устранения проблем, настройки и ведения железного сервера на hetzner.de, требуется специалист, администратор или консультант. Описание железа, его программного обеспечения и текущего положения дел опубликовано на ...

Если Вы верите, что справитесь, дайте свои предложения по часовой ставке и другим условиям работы. На техническом интервью, будьте готовы обсудить:

  • Узкие места построения этого железа и его программного обеспечения;
  • Архитектуру компьютерной сети и портов;
  • Оба инцидента и путей разрешения проблем;
  • Общие рекомендации по повышению безопасности этого железа и его программного обеспечения.

Мы планируем заключить годовой контракт на обслуживание.

Требования
  • Готовность и желание развиваться и учится
  • Желание работать с информационными системами и их безопасностью (кибербезопасностью).
  • Базовые знания современных сетевых технологий и, в частности, конфигурирования серверов на базе Linux
  • Опыт работы в должности системного администратора приветствуется.
Обязанности
Документирование. Разработка архитектуры. Обеспечение работы корпоративных сайтов и почтовых систем. Внедрение процессов безопасности, обеспечивающих надлежащую защиту ИТ и информационных активов. Контроль за их выполнением и отчетность. Снова документирование.
Условия работы
Работа в дружном коллективе. Удаленная. Уровень заработной платы устанавливается по результатам отбора
Порядок отбора
  1. Задайте любое количество вопросов.
  2. Когда вопросы окончены, в течение 20-25 минут опишите, что конкретное Вы можете сделать для проекта.
  3. Если Вас отберут для технического собеседования, установите TeamViewer, если он не установлен, и будьте готовы поработать вместе с нашим специалистом в течение 20-25 минут на реальных серверах.
По итогам технического собеседования, Вас могут пригласить на обсуждение условий сотрудничества.

Архитектура

Требования к архитектуре

  1. отказоустойчивость и высокая доступность основных приложений. На данный момент, Брацкой Правки, Брацкой Учебки, Брацкой Сетки.
  2. минимальная стоимость.
  3. максимально-возможноe разнообразиe в рамках требования по минимальной стоимости.

Создание инфраструктуры должно происходить как можно быстрее и с наименьшими затратами, временно, возможно, в ущерб качеству. Подразумевается, что качество будет достигнуто в результате доработки жизнеспособных прототипов.

При том, что отказоустойчивость на является глобальным требованием ко всем частям инфраструктуры, любая часть жизнеспособного прототипа инфраструктуры должна быть:

  1. наблюдаемым средствами мониторинга,
  2. восстанавливаемым в случае проблем,
  3. связанным воедино, в частности, средствами SSO, и
  4. обеспечивающим CDN и Geocast для основных приложений.

Идеи

Предварительные идеи по архитектуре таковы:

  1. Один железный сервер с относительно небольшой производительностью и относительно большим объёмом диска будет служить платформой для Опытна Облака. Eго виртуализация поддержит эксперименты при том, что отказоустойчивость для них не принципиальна.
  2. Один- два отказоустойчивых кластера или отказоустойчивый кластер и небольшое облако для основных приложений.
  3. Несколько VPS в разных частях света, идельно, поддерживаемых CDN и с базами, завязанными в кластеры. Теоретически, их отказоустойчивость может достигаться либо отказоустойчивостью баз, либо дополнительными услугами хостеров типа Floating IP у DigitalOcean.
  4. Общественное облако, особенно, для Брацкой Вебки и, возможно, Брацкиx Жиц.

Материальная часть

Требования к материальной части изложены на https://pve.proxmox.com/wiki/System_Requirements

Железо 1

Железный сервер (bare metal) арендован на Hetzner. Он имеет такие характеристики:
  • Dedicated Root Server SB35
  • Intel Core i7-3930
  • 2x HDD SATA 3,0 TB
  • 8x RAM 8192 MB DDR3
  • NIC 1 Gbit - Intel 82579LM
  • Location: FSN1 (Falkenstein/Vogtland, Germany) -- DC7
  • Rescue system (English)
Основной IP адрес Железа -- наш-IP . На начало февраля 2022, Железо использует один дополнительный IP адрес 4-го протокола (IPv4):
  • IP: 5.9.40.133
  • Gateway: 5.9.40.129
  • Netmask: 255.255.255.224
Не предпринималось попыток работать с IP адресами 6-го протокола (IPv6).
Два инструмента задействованы для виртуализации:
  1. На уровне основного сервера, виртуализация выполнена средствами RAID, то есть два жёстких диска HDD SATA действуют как один диск на 3,0 TB, обеспечивая сохранение данных в случае отказа одного из дисков.
  2. Для создания виртуальных машин и работы с контейнерами, установлена среда ProxmoxVE.

Железо 2

Характеристики второго (bare metal) сервера:
  • Dedicated Root Server
  • Intel Xeon E3-1245
  • 2x HDD SATA 3,0 TB Enterprise
  • 4x RAM 8192 MB DDR3 ECC
  • NIC 1 Gbit Intel 82574L
  • RAID Controller 4-Port SATA PCI-E LSI MegaRAID SAS 9260-4i
  • Location: FSN1 (Falkenstein/Vogtland, Germany) -- DC7
  • Rescue system (English)

На основном сервере используется либо локальный IP, либо частный диапазон IP с DHCP. Если не возникнет особых проблем, мы планируем использовать 2 адреса IPv4. Мы также открыты для изучения IPv6. Если мы используем адреса About ipv4, нам нужно 5 ips: один для основного сервера, два для шлюза, три для любого vps или контейнера и четыре для Wordpress vps, и 5 для любого другого, который нам понадобится в будущем.

ProxmoxVE поставляется с OpenZFS, поэтому мы настоятельно рекомендуем использовать его. Также будут обсуждаться другие реализации программных RAID на различных уровнях. На данном этапе мы не рассматриваем аппаратные решения, чтобы избежать зависимости от проприетарных карт RAID.

VPS ресурсы

DigitalOcean

Описание URL Технология Предназначение Проблемы
NYC1, 2GB, 50GB disk, IP 159.89.93.1, $10 в месяц Новый дроплет под Оплёт
  • Opplet на opplet.net -- самописанная на Yii система управления пользователями
Проблем нет; это -- один из двух активно используемых дроплетов на данный момент -- Backups are currently enabled
NYC1, 2GB, 50GB disk, IP 159.89.230.212, $10 в месяц Новый дроплет под систему для работы с Оплётом
  • Инсталляция Redmine -- она стоит отдельно от всего для использования исключительно администраторами.
  • Инсталляция Moodle на https://wiki.ksacerts.com

Contabo

Доступы

Администраторские

Управление виртуальными машинами и контейнерами производится через интерфейс ProxmoxVE. Остальные доступы организованы по SSH.

Пользовательские

Для доступов пользователей к виртуальным машинам используется Apache Guacamole, на котором построен узел удаленных рабочих столов. Пользователь заходит на машину и работает на ней аналогично работе на собственном компьютере или друго устройстве.

Защита

Для предотвращения так называемых brute-force attack, то есть попыток подобрать пароли методом перебора множества вариантов, был установлен Fail2Ban.
При предоставлении доступа через SSH к тем машинам, на которых был установлен WordPress и Moodle, там постоянно что-то происходило, не давало зайти по SSH. Именно на этих 2-х машинах Fail2Ban был отключен первым.
Далее, Fail2Ban делал записи в iptables, из-за которых невозможно было получить доступ к серверам по SSH для Apache Guacomole. После этого Fail2Ban был заблокирован.

Инфраструктура Облака включает в себя виртуализованное Опытно Облако, используемое для экспериментов, и эксплуатационное облако, архитектура которого пока не определена. Ранее для эксплуатационного облака использовался OpenStack. Скорее всего, когда работа Школы войдёт в привычный режим, инфраструктура эксплуатационного облака должна состоять из некой комбинации частного и общественных облаков.

Вычислительные сервера

В настоящее время, используется пять виртуальных частных серверов (virtual private server; VPS):
  1. Три арендованы у Contabo; два сервера и отдельное дисковое пространство для резервных копий располагаются в Сент-Луисе, Миссури, США, один -- в Германии. Планов уезжать с Contabo нет, но есть план заменить один сервер в Сент-Луисе, Миссури на сервер в Сингапуре;
  2. Два VPS (они зовут их "дроплетами") арендованы у DigitalOcean; один располагается в Нью-Йорке, США, один -- во Франции. Планов уезжать с DigitalOcean нет.
Для создания собственных виртуальных серверов, скорее всего, будет арендован физический сервер (bare metal) у Hetzner в Германии.

Мониторинг

Мониторинг систем включает мониторинг работы как вычислительных серверов, так и приложений.
  1. Для мониторинга систем, установлен Nagios Core. Используя агентов слежения, он отслеживает работу всех серверов системы, включая:
    • Доступность сетевых услуг (SMTP, POP3, HTTP, NNTP, ICMP, SNMP, FTP, SSH).
    • Использование ресурсов (processor load, disk usage, system logs, количество активных пользователей).
    • Доступность баз данных (в настоящее время -- MariaDB Server, в перспективе -- отслеживание и других услуг кластеров).
    • Состояние сертификатов SSL. Для отслеживания сертификатов, несколько инструментов не подошли, показывали срок действия один на все домены. Выбор был остановлен на check_ssl_cert. Отслеживаемые домены были объеденены в host groups и единую сервисную группу. Результат удовретворительный. Нужно будет подобавлять все нужные домены.
    Мониторинг осуществляется как через админовский интерфейс, так и через почтовые уведомления. Также был установлен Zabbix, но его пока не получилось подключить к базам данных. Планируется далее продолжить просмотр других специализированных приложений.
  2. Для мониторинга отдельных приложений и баз данных, помимо систем сетевого мониторинга, планируется использовать их внутренние функции, а также другие существующие решения.

Почтовый сервер

Команда планирует поднять highload мультидоменный почтовый сервер на основе существующего. На данный момент установлены чистые Postfix, Dovecot и Roundcube без каких-либо коробок. Они позволяют:
  1. Зарегестрироваться на opplet с почтовым адресом *@cnmcyber.com
  2. С этим адресом зайти на RoundCube
  3. Отправить почту себе на email
Настроены следующие DNS-записи:
  • DomainKeys Identified Mail (DKIM)
  • Sender Policy Framework (SPF)
  • Domain-based Message Authentication, Reporting and Conformance (DMARC)
Не известно, шифруется ли почта TLS протоколом. Количество пользователей не определено -- все, кто имеет право на почту, должен её иметь. В перспективе в Оплёте будет добавлено одно поле для корпоративного имейла. Проблемы с дисковыми пространствами будут решаться отдельно.
Требуется:
  • Выбрать, установить, настроить, провести нагрузочное тестирование, отмониторить продакшн и откоректировать параметры такого решение для почты, которое бы дружило с нашим WSO2 IS, через который идёт управление пользователями.
  • Добиться того, чтобы почта приходила не в спам, а во входящие.
  • Задокументировать работающие решения и настройки.
В качестве подходящего обеспечения рассматривались три варианта:
  1. Оставить чистые Postfix, Dovecot и Roundcube без каких-либо коробок.
  2. Переключить на пакет iRedMail, который включает в себя Postfix, Dovecot, Roundcube. Когда Облако строилось на OpenLDAP, был найден подрядчик, требования которого были: 1. Что бы у всех пользователей было заполнено поле mail 2. Новый пользователь vmail (пароль скажут после установки пакета iRedmail) 3. Поле для квоты. Также обсуждался безопасный тунель между сервером почты и сервером OpenLDAP. Найденный подрядчик считал, что лучшее решение -- это использование VPN, чтобы и OpenLDAP, и Dovecot виртуально были бы в одной сети. Авторизация почтового сервера идёт через Dovecot. Другой специалист называл такое решение идиотским. После решения о переходе с OpenLDAP на WSO2 IS подрячиков не искали.
  3. Добавить OnlyOffice, который включает в себя всё тот же iRedMail, но только с авторизацией уже на платформе OnlyOffice. Похоже,OnlyOffice предоставляет возможность синхронизации пользователей с LDAP, но пока не известно, как он интегрируется с WSO2 IS.
Почтовые ящики работают на основе построенного сервера.

Склад файлов

Данные в Облаке

Базы данных

Облако задействует большой спектр систем управления базами данных, некоторые из которых структурированы, а некоторые ориентированы на документы.
  1. Наибольшая часть пользовательских приложений использует базы управления данными на основе MariaDB Server. Администраторское приложение PhpMyAdmin используется для администрирования каждого из них.
  2. Отдельные приложения, например, Брацка Крынка и Брацка Справа, задействуют базы управления данными на основе PostgreSQL.
  3. Обособленная установка MariaDB Server, отличная от той, что поддерживает большую часть пользовательских приложений, также вовлечена в управление пользователями Оплёта.
  4. Идентификационный сервер Оплёта, то есть та его часть, которая работает с другими приложениями, построен на базе сервера WSO2 IS и задействует три базы H2 DBMS.
  5. NoSQL и структурированные распределённые базы будут задействованы в работу будущей интеграционной платформы Оплёта.

Интеграция данных

  1. Сейчас, база каждого пользовательского приложения установлена на трёх нодах и синхронизована через Кластерное копирование. Есть план сделать одну распределённую базу и интегрировать её в Оплёт с тем, чтобы базы приложений забирали данные оттуда. В качестве интеграционного решения серъёзно рассматривается WSO2 Enterprise Integrator. Этот интегратор работает и как ESB, и платформа для микросервисов. В качестве распределонной базы один специалист рекоммендовал NoSQL -- Apache Cassandra. Другой вариант -- распределённую SQL типа CockroachDB.
  2. Наиболее приоритетная задача -- создать архитектуру базы клиентов. Сейчас клиенты учитываются в нескольких независимых приложениях. Они имеют CRM модули, которые призваны учитывать работу с клиентами, которые могут является, но скорее всего не являются пользователями. Надо создать базу, в которую каждое приложение заливало новые данные и брало старые. Предложение заключалось в общей master базе, информация в которую может вбиваться с любого приложения, но отображаться в зависимости от её публичности.
  3. Есть также предложение создать собирать данные с различных приложений и хранить их в NoSQL базе. Ранее обсуждалась единая неосновная база данных для всей системы. Разговор шёл о комбинации Hadoop, ESB Mule и MongoDB. Идея была в сборе данных с разных приложений через ESB Mule, причёсывание их Hadoop'ом и размещение в MongoDB как дополнительной базе данных, откуда они могут браться для для личного кабинета (dashboard) пользователя. То есть, заходя в кабинет, пользователь мог бы в идеале видеть свою активность в разных приложениях и искать по всем системам сразу.
  4. Надо стабилизировать загрузку, хранение и использование картинок на MediaWiki. Сейчас они спорадически не загружаются или не отображаются. Например, 7 декабря картинки выбились, перестав отображаться. После клика на редактирование и сохранение, картинки появлялись -- этот сценарий повторялся на нескольких страницах. Затем всё само восстановилось. Аналогичные сбои происходили и раньше. Сама Википедия использует другую схему. Мы рассматриваем перенос картинок в хранилище.

Основные функции

Аварийное восстановление

Инструкция по восстановлению инфраструктуры после аварии должна позволить восстановить отдельные:

Связки баз данных

Архитектура Кластеров баз данных, то есть связок нескольких однотипных приложений или их баз данных с распределителями нагрузки между этими приложениями или базами, используется для обеспечения отказоустойчивости (high availability) Облака.

Ярус Название Основное ПО ПО базы данных Кластер
Связующее обеспечение Оплёт (ядро) Yii MariaDB Server Кластер Оплёта
Идентификация WSO2 IS H2 DBMS
Пользовательские приложения Бачка AVideo MariaDB Server Кластер MariaDB
Вебка WordPress
Жици Jitsi Отсутствует Устойчивость для Жици
Крынка GitLab PostgreSQL Кластер PostgreSQL
Пошта Roundcube
Правка MediaWiki MariaDB Server Кластер MariaDB
Связка SuiteCRM
Сетка HumHub
Справа Odoo PostgreSQL Кластер PostgreSQL
Учебка Moodle MariaDB Server Кластер MariaDB
  Арендованное обеспечение
Эксперементальные приложения Campus OpenEdX
  • MariaDB Server для данных пользователей;
  • MongoDB для непользовательских данных.
Agile Taiga software PostgreSQL
Project ProjecQtOr

Стойкость

Основная вики-страница: Стойкость Ферм

Резервное копирование

В Облаке, к резервному копированию применяется несколько подходов. Копируются приложения и сервера; сохраняются базы и делаются снимки.
  • Изначально использовался rsync для копирования файлов, еженедельно полный бэкап и ежедневно incremental бэкап заливались на backup space на Contabo. Была идея использовать rsnapshot для снимков, но эту идею пока не получилось реализовать.
  • Весной-летом 2021 года, начались эксперименты с Veeam Agent for Linux, для которого был установлен VNC® Viewer. Это обеспечение позволило копировать полный сервер. Сервера копируются на себя, что вначале это вызывало проблему нехватки места. В настоящее время, копируются только новые данные (increment). Таким образом избегается дублирование и экономится место. Далее планируется научиться копировать сервера на backup space.
Надо создать:
  1. Подробное описание существующей системы.
  2. Процедуру проверки надёжности бэкапов.

Кластеры баз данных

Связка нескольких однотипных приложений или их баз данных с распределителем нагрузки между этими приложениями или базами называется кластером. Фермы задействуют четыре кластерa; стойкость баз Ферм складывается из стойкости отдельных кластеров. Эти кластеры обеспечивают согласие между однотипными базами данных и, соответственно, стойкость их данных.

Все пользовательские приложения дублируются -- копии каждого из них установлены как минимум на трёх вычислительных узлах. Базы данных разных установок одного и того же приложения синхранизуются. Таким образом, обращаясь к любому из них, пользователь получает аналогичные данные и результаты вычислений.

Должна быть рассмотрена возможность переделки кластеров баз данных Ферм в отказоустойчивые (high-availability cluster) в дополнение к Стойкости Ферм.

Возможно, отказоустойчивости можно достичь, если направлять пользователя на распределитель нагрузки (load balancer) когда пользователь хочет обратиться к приложению. Распределитель нагрузки постоянно связывается со всеми установками приложений, чтобы знать, какие из них находятся в наличии. От распределителя нагрузки, пользователь перенаправляется к той установке, которая работоспособна и доступнее для конкретного пользователя. Если какая-то из установок выходит из строя, пользователь этого не должен заметить. Как только распределитель нагрузки замечает отсутствие какого-либо ресурса, он запускает механизм отладки.

Кластер Жици

Основная вики-страница: Устойчивость для Жици
Вместе с Брацкой Вебкой, наиболее критическое приложение для маркетинга всего проекта -- это Брацки Жици на Jitsi. Эта видео-конференционная система пока установлена вместе с пользовательскими системами. Возможно, для него должен быть построен отдельный кластер, задействующий все имеющиеся в наличии сервера. Также обсуждается план увести её отдельно на CDN типа Cloudflare или глобальные облачные решения -- Microsoft Azure или AWS -- участники конференций могут находиться на разных континентах и требование к качеству особо высокое.

Кластер MariaDB

Основная вики-страница: Кластер MariaDB

Кластер Оплёта

Основная вики-страница: Кластер Оплёта
Кластер Оплёта -- это связка ресурсов Облака, обеспечивающая отказоустойчивость Оплёта, а также распределителей нагрузки (load balancer) остальных кластеров.

Кластер PostgreSQL

Основная вики-страница: Кластер PostgreSQL

Частное облако

Если частное облако будет признано необходимым, оно будет построено на OpenStack технологии. Требования: существование резервной модели работы и возможность восстановления работоспособного состояния, включая бэкапы на все собственные данные и разработки.

Общественное облако

Общественное облако типа AWS должно быть использовано первым из-за меньших расходов по его вводу в эксплуатацию.

Разработка Ферм

Разработка Ферм -- это совокупность проектов по разработке Брацких Ферм (здесь и далее по тексту -- Ферм).


Инциденты с сетью

Стандартные сообщения

We have detected that your server is using different MAC addresses from those allowed by your Robot account. Please take all necessary measures to avoid this in the future and to solve the issue. Please visit our FAQ here, if you are unsure how to proceed: https://docs.hetzner.com/robot/dedicated-server/faq/error-faq/#mac-errors

Работа с сетью

Были попытки разрешить проблемы с сетью; однако, сообщения продолжаются.

Инциденты с портами

В середине декабря, немецкая национальная служба по авариям уведомила hetzner.de о проблемах с разметкой портов Железа.

Сообщение от 15 декабря

Dear Sir or Madam, the Portmapper service (portmap, rpcbind) is required for mapping RPC requests to a network service. The Portmapper service is needed e.g. for mounting network shares using the Network File System (NFS). The Portmapper service runs on port 111 tcp/udp.

In addition to being abused for DDoS reflection attacks, the Portmapper service can be used by attackers to obtain information on the target network like available RPC services or network shares.

Over the past months, systems responding to Portmapper requests from anywhere on the Internet have been increasingly abused DDoS reflection attacks against third parties.

Please find below a list of affected systems hosted on your network. The timestamp (timezone UTC) indicates when the openly accessible Portmapper service was identified.

We would like to ask you to check this issue and take appropriate steps to secure the Portmapper services on the affected systems or notify your customers accordingly.

If you have recently solved the issue but received this notification again, please note the timestamp included below. You should not receive any further notifications with timestamps after the issue has been solved.

Additional information on this notification, advice on how to fix reported issues and answers to frequently asked questions: https://reports.cert-bund.de/en/

Affected systems on your network:

  • Format: ASN | IP | Timestamp (UTC) | RPC response
  • 24940 | наш-IP | 2021-12-14 15:24:55 | 100000 4 111/udp; 100000 3 111/udp; 100000 2 111/udp; 100000 4 111/udp; 100000 3 111/udp; 100000 2 111/udp;

Решение проблемы

Проблема решена посредством установления данных фильтров:

-A INPUT -s наш-IP/24 -p udp -m udp --dport 111 -j ACCEPT

-A INPUT -s 127.0.0.1/32 -p udp -m udp --dport 111 -j ACCEPT

-A INPUT -p udp -m udp --dport 111 -j DROP

Много переделывали и на сервере возникла блокировка данного порта. Возникла из-за того, что у Hetzner есть своя специфика, нужно просто не забывать о ней.

Инциденты атак

В конце января, похоже, что роботы внедрились в среду ProxmoxVE, стали захватывать виртуальные машины и использовать их для атак на другие узлы сети Интернет.

Сообщение от 24 января

An attempt to brute-force account passwords over SSH/FTP by a machine in your domain or in your network has been detected. Attached are the host who attacks and time / date of activity. Please take the necessary action(s) to stop this activity immediately. If you have any questions please reply to this email.

  • Host of attacker: наш-IP => static.   .   .   .clients.your-server.de => your-server.de
  • Responsible email contacts: abuse@hetzner.de, abuse@hetzner.com
  • Attacked hosts in our Network: 77.75.251.49, 37.228.156.186, 77.75.251.92

Logfile entries (time is CE(S)T):

  • Mon Jan 24 13:37:16 2022: user: root service: ssh target: 77.75.251.49 source: наш-IP
  • Mon Jan 24 13:36:09 2022: user: root service: ssh target: 37.228.156.186 source: наш-IP
  • Mon Jan 24 13:35:58 2022: user: root service: ssh target: 77.75.251.92 source: наш-IP

The recipient address of this report was provided by the Abuse Contact DB by abusix.com. Abusix provides a free proxy DB service which provides the abuse@ address for all global RIRs. Abusix does not maintain the core DB content but provides a service built on top of the RIR databases. If you wish to change or report a non-working abuse contact address, please contact the appropriate RIR responsible for managing the underlying data. If you have any further questions about using the Abusix Abuse Contact DB, please either contact abusix.com directly via email (info@abusix.com) or visit the URL here: https://abusix.com/contactdb. Abusix is neither responsible nor liable for the content or accuracy of this message.

Попытка запрета на выход

В качестве реакции, была предпринята первая попытка запрета на исходящий траффик:
:INPUT DROP [1:40]
:FORWARD DROP [54:2844]
:OUTPUT DROP [27:13812]

Сообщения от 24 и 26 января

Netscan detected from host наш-IP
timeprotocolsrc_ipsrc_port dest_ipdest_port
Wed Jan 26 05:16:08 2022TCPнаш-IP49896=>192.168.0.122
Wed Jan 26 05:16:08 2022TCPнаш-IP35838=>192.168.0.222
Wed Jan 26 05:16:08 2022TCPнаш-IP52894=>192.168.0.322

Чтобы сохранить место, только верхние линии таблицы опубликованы. Аналогичные атаки повторились 26-го января.

Обновлённая попытка запрета

В качестве реакции, была предпринята новая попытка запрета на исходящий траффик:
-A FORWARD -p tcp -m tcp --dport 22 -j LOG
-A FORWARD -o vmbr0 -p tcp -m tcp --dport 22 -j DROP
-A OUTPUT -p tcp -m tcp --dport 22 -j LOG
:OUTPUT DROP

Сообщение от 27 января

We have received information regarding spam and/or abuse from botnet.tracker@gmail.com. Please would you take all necessary measures to avoid this in the future:

This is a notification of unauthorized uses of systems or networks.

On January 26, 2022, a total of 29 IP addresses from your networks probed my servers for TCP open ports. Due to their dubious behavior, they are suspected to be compromised botnet computers.

The log of TCP port scans is included below for your reference (time zone is UTC). To prevent this mail from getting too big in size, at most 5 attempts from each attacker IP are included. Those connection attempts have all passed TCP's 3-way handshake, so you can trust the source IP addresses to be correct.

If you regularly collect IP traffic information of your network, you will see the IPs listed connected to various TCP ports of my server at the time logged, and I suspect that they also connected to TCP ports of many other IPs.

If a Linux system was at the attacker's IP, you might want to use the command "netstat -ntp" to list its active network connections. If there is still some suspicious connection, find out what PID/program/user ID they belong to. You might find something to help you solve this problem.

Please notify the victims (owners of those botnet computers) so that they can take appropriate action to clean their computers, before even more severe incidents, like data leakage, DDoS, and the rumored NSA spying through hijacked botnets, arise. This also helps prevent botnets from taking up your network bandwidth.

Daily Botnet Statistics

  • (time in UTC)=2022-01-26T21:50:03 (attacker's IP)=наш-IP (IP being scanned)=140^238^215^81 (TCP port being scanned)=4234
  • (time in UTC)=2022-01-26T23:39:58 (attacker's IP)=наш-IP (IP being scanned)=61^61^170^210 (TCP port being scanned)=10056
  • (time in UTC)=2022-01-26T23:56:33 (attacker's IP)=наш-IP (IP being scanned)=172^245^241^177 (TCP port being scanned)=6240
  • (time in UTC)=2022-01-26T23:56:55 (attacker's IP)=наш-IP (IP being scanned)=185^219^132^53 (TCP port being scanned)=1001
  • (time in UTC)=2022-01-26T23:57:45 (attacker's IP)=наш-IP (IP being scanned)=185^219^132^53 (TCP port being scanned)=10081

Отключение машин

Изучение логов показало, что изначальные проблемы связаны с той виртуальной машиной, на которой была установка WordPress. Эта машина была отключена. Далее в логах показалась машина с установкой Moodle. После этого, было решено отключить все машины до выяснения причин и нахождения средств защиты. Фактически, заражённое Железо отправлено на карантин.

Перечень проектов

Доменные проекты

Доменные проекты -- это усилия по улучшению Веб-доступности.
Профинансированные проекты доменов
Работы CDN DNSSEC IPv6 Переадресация Ревизия DNS
Запрос Достаточно Достаточно Достаточно Достаточно
Требования        
Архитектура        
Модель        
Прототип        
Заказ        
Производство        
Конфигурация        
Усовершенствование        

Проекты кластеров баз

Проекты кластеров баз -- это усилия по построению Кластеров.
Профинансированные проекты кластеров баз данных
Работы MariaDB PostgreSQL Жици Оплёта
Запрос Достаточно Достаточно Достаточно Достаточно
Требования        
Архитектура        
Модель        
Прототип        
Заказ        
Производство        
Конфигурация        
Усовершенствование        

Сетевые проекты

Сетевые проекты -- это усилия по построению Сетевой инфраструктуры Облака, включая Данные в Облаке. Усилия по построению Кластеров выделены в Кластерные проекты.
Профинансированные проекты сетей инфраструктуры
Работы Восстановление Копирование Мониторинг Отказоустойчивость Склад
Запрос Достаточно Достаточно Достаточно Достаточно
Требования        
Архитектура        
Модель        
Прототип        
Заказ        
Производство        
Конфигурация        
Усовершенствование