Почему медленно работает сервер?
Расскажу поэтапно, что бы было более понятно. Просьба написать в комментарии к вопросу если какие то дополнительные данные нужны, выясню. Сотрудники (~40 человек) работают через RDP на удалённом сервере. Работа элементарная, в офисных программах, 1С. Так сложилось исторически, это меняться не будет, во всяком случае в обозримом будущем. Выглядело это так же просто, на голое железо накатан win server 2019, в 1 рейде было 2 hdd 1tb. Конфигурация сервера следующая:
HP DL360 gen9/2x E5-2680v4/RAM 196Gb/2xSATA 960Gb/HDD 1Tb/ RAID HP P440ar 2Gb
Работало всё не так уж быстро, но стабильно. Помимо слабого железа были и другие проблемы, все сервисы в одном месте. 1С,субд, пользователи с их рдп сессиями, прочие программы.
Далее количество людей возросло, требование к быстродействию так же. Надо было что-то менять и мы решили приобрести сервер. Его изначальная конфигурация:
Dell R660 8SFF / 2х6444Y / 4х64GB DDR5 / H965i / 2хSSD 3,84TB NVMe (intel ssd d7 p5520 series 3.84 tb ssdpf2kx038t1) / 6хHDD 2,4TB SAS / 2х1,4kW / iDRAC9 Ent
NVMe установлены в саму материнку, а не в рейд контроллер!(из за невозможности установить nvme в этот рейд, о чем поставщик умолчал). По подсчетам такого объема RAM должно было хватить на 1-2 года, а мощности процессора в купе с nvme дисками должны были дать ощутимый прирост к быстродействию системы, файлов не столь ощутимо, т.к. они хранились на сасах, но в целом, всё должно было быть ок. Но если бы это было так, я бы сейчас не задавал этот вопрос, потерянный от непонимания причин.
Проясню, что я совсем не разбираюсь в серверном железе, могу только оценить/сравнить цифры, потоки, ширина шины, объем кэшей и прочее, но про совместимость ноль понимания. То же касается и софтовой части, в общих чертах знаю как работает виртуализация, но не в деталях. Сам я не занимаюсь процессом, но контролирую его.
Это было предисловие, а сейчас к самой проблеме: Установили proxmox, сделали вм для домена и обменки (WinS2025), вм для 1с, вм для рдп WinS2025. Был сделан 1 рейд nvme на базе софтового рейда, остальные сасы в 5 рейд на базе 965 рейд контроллера. При тестировании(тест гилёва, обычный файловый серфинг) система показывал себя хуже пентиума. Папки, файлы открывались очень медленно, тест гилёва показывал ~20 баллов. Решили протестировать nvme без рейда, тест гилёва показывал 70+, но скорость работы не сильно увеличилась (тут я могу быть не точным, т.к. это слова админов, замеры скорости никакие не остались) Было проведено в общей сложности около 20и тестов. 1С на nvme. 1С не на нвме но на сасах, 1с без нвме, чистая нвме где только 1С. В том числе был ряд других тестов. С виртуализацией на гипер-ви. и VMware. по результатам показатели были идентичными. Так же был тест установки WinS2025/2019 без вирутализации на голое железо. Везде nvme показывал себя плохо.
Обратившись к поставщикам по гарантии, после их проверки, нам было сказано, что железо работает как и должно, опущу все подробности, но если вкратце, тогда я принял решение поставить вместо nvme еще 2 таких же саса, т.к. они хотя бы показывали нормальные показатели в гилёве.
После переноса всего рабочего процесса людей на новый сервер мы столкнулись с валом проблем, но что касается моего вопроса, это зависания, падение сервера, резкое потребление ram с 30% до 100% с последующим падением сервера, медленная работа файлов(макросов в них, обновление формул), 1С, совсем не лучше предыдущего сервера. Админы говорят, что это из-за памяти, т.к. proxmox забирает 25% от выделенного объема, т.е. 120+- гб на рдп ему не хватает, тоже и с 1с, 100гб ему не хватает - в связи с чем идёт перераспределение памяти текущих сессий и как следствие зависания и тормоза. Загрузка часто доходит до 75%.
В состоянии полной неопределенности и понимания я хочу найти ответы, получается, на 2 основных вопроса: Почему при изначальной сборке(на nvme) могло работать не так? (пожалуйста от наиболее вероятной причине к наименее) Почему, после замены nvme, система всё ещё работает медленно, в частности открытие файлов/обработка макросов/формул/1С? Что я могу проверить, что админы настроили корректно, а что нет? Что является правильным/best practice при настройке в таком виде?
Буду благодарен за любую помощь!