студент
Россия
сотрудник
Военно-космическая академия имени А. Ф. Можайского (Кафедра математического и программного обеспечения, Профессор)
сотрудник
Россия
ВАК 2.3.1 Системный анализ, управление и обработка информации, статистика
УДК 004.942 Исследование поведения объекта на основе его математической модели
Экспоненциальный рост объемов данных в облачных средах делает критически важной задачу их эффективного сжатия для оптимизации использования ресурсов хранения, пропускной способности сети и вычислительных мощностей, что напрямую влияет на экономическую и операционную эффективность. Цель: провести сравнительный анализ современных алгоритмов сжатия без потерь для определения оптимальных сценариев их применения в облачных платформах. Результаты: систематизированы принципы работы и классификация современных алгоритмов сжатия без потерь. На основе сравнительного анализа по ключевым параметрам (коэффициент сжатия, скорость операций, ресурсоемкость) определены сценарии оптимального применения алгоритмов Gzip, LZ4, Zstandard и Brotli в облачных сервисах. Практическая значимость: полученные результаты можно использовать для оптимизации затрат на облачную инфраструктуру и повышения производительности распределенных систем обработки данных. Обсуждение: проведенный анализ демонстрирует, что выбор алгоритма зависит от специфики задачи. Использование аппаратного ускорения позволяет значительно повысить производительность компрессии.
компрессия данных, сжатие без потерь, облачные вычисления, алгоритмы сжатия, Gzip, LZ4, Zstandard, Brotli, производительность облачных систем, оптимизация затрат, сетевой трафик, аппаратное ускорение
1. Верзилин Д. Н., Максимова Т. Г., Шаныгин С. И. Облачные технологии в развитии институтов цифровой трансформации российской экономики: статистическое исследование // Вестник Санкт-Петербургского университета. Экономика. 2025. Т. 41, вып. 1. С. 146–178. DOI:https://doi.org/10.21638/spbu05.2025.107. EDN: https://elibrary.ru/VHOHTM
2. Давыденко Е. А., Сабиргалиева А. М. Архивирование и сжатие файлов в Linux: методы, алгоритмы и их эффективность // Научный вестник гуманитарно-социального института. 2025. № 20. 5 с. EDN: https://elibrary.ru/MNHKMT
3. Чуркин Я. М. Сжатие алгоритмом Хаффмана // Инструменты и механизмы устойчивого инновационного развития: сборник статей по итогам Всероссийской научно-практической конференции (Самара, Россия, 6 февраля 2022 г.). Стерлитамак: Агентство международных исследований, 2022. С. 20–22. EDN: https://elibrary.ru/YSDNPE
4. Левин И. И., Дудников Е. А. Структурная модификация метода Хаффмана для сжатия плотных потоков данных без потерь на РВС // Известия Южного федерального университета. Технические науки. 2024. № 5 (241). С. 48–58. DOI:https://doi.org/10.18522/2311-3103-2024-5-48-58. EDN: https://elibrary.ru/NDMYMD
5. Howard P. G., Vitter J. S. Arithmetic Coding for Data Compression // Proceedings of the IEEE. 1994. Vol. 82, iss. 6, pp. 857–865. DOI:https://doi.org/10.1109/5.286189.
6. Добычин Р. С., Петров А. Р. Сравнительный анализ работы алгоритмов Шеннона — Фано и Хаффмана // Междисциплинарные исследования в области математического моделирования и информатики: материалы 7-й научно-практической internet-конференции (Тольятти, Россия, 30–31 марта 2016 г.). Ульяновск: Зебра, 2016. С. 12–14. EDN: https://elibrary.ru/VPXXLB
7. Kreft S., Navarro G. LZ77-Like Compression with Fast Random Access // Proceedings of the 2010 Data Compression Conference (Snowbird, UT, USA, 24–26 March 2010). Institute of Electrical and Electronics Engineers, 2010. Pp. 239–248. DOI:https://doi.org/10.1109/DCC.2010.29.
8. LZ78 Compression in Low Main Memory Space / D. Arroyuello [et al.] // String Processing and Information Retrieval (SPIRE 2017): Proceedings of the 24th International Symposium, (Palermo, Italy, 26–29 September 2017). Lecture Notes in Computer Science. Vol. 10508 / G. Fici [et al.] (eds). Cham: Springer, 2017. Pp. 38–50. DOI:https://doi.org/10.1007/978-3-31967428-5_4.
9. Dheemanth H. N. LZW Data Compression // American Journal of Engineering Research. 2014. Vol. 3, iss. 2. Pp. 22–26.
10. Faykus M. H., Calhoun J., Smith M. Lossy and Lossless Compression for BioFilm Optical Coherence Tomography (OCT) // SC-W 2023: Proceedings of the Workshops of the International Conference on High Performance Computing, Network, Storage, and Analysis (Denver, CO, USA, 12–17 November 2023). New York: Association for Computing Machinery, 2023. Pp. 281–288. DOI:https://doi.org/10.1145/3624062.3625125.
11. PymzML v2.0: Introducing a Highly Compressed and Seekable GZip Format / M. Kösters [et al.] // Bioinformatics. 2018. Vol. 34, no. 14. Pp. 2513–2514. DOI:https://doi.org/10.1093/bioinformatics/bty046. EDN: https://elibrary.ru/VATXGQ
12. Oswal S., Singh A., Kumari K. Deflate Compression Algorithm // International Journal of Engineering Research and General Science. 2016. Vol. 4, iss. 1. Pp. 430–436.
13. Design and Optimization of Zstandard Algorithm Based on Concurrent Streaming of Multiple Hash Tables / L. Zheng [et al.] // Proceedings of the Second International Conference on Laser, Optics and Optoelectronic Technology (LOPET 2022) (Qingdao, China, 20–22 May 2022). Proceedings of SPIE. Vol. 12343. Bellingham (WA): Society of PhotoOptical Instrumentation Engineers, 2022. Pp. 571–576. DOI:https://doi.org/10.1117/12.2649516.
14. Эффективное сжатие лог-файлов: анализ производительности LZ4, Zstandard и гибридного подхода / И. Г. Рзун [и др.] // Вестник Академии знаний. 2025. № 4 (69). C. 435–443. EDN: https://elibrary.ru/EKTQIC
15. Brotli: A General-Purpose Data Compressor / J. Alakuijala [et al.] // ACM Transactions on Information Systems. 2019. Vol. 37, iss. 1. Art. no. 4. 30 p. DOI:https://doi.org/10.1145/3231935.
16. Гаврикова С. В. Обзор баз данных временных рядов // International Journal of Open Information Technologies. 2023. Vol. 11, no. 11. Pp. 83–102. EDN: https://elibrary.ru/JCGZBP
17. Google BigQuery // Bisong E. Building Machine Learning and Deep Learning Models on Google Cloud Platform: A Comprehensive Guide for Beginners. Berkeley (CA): Apress, 2019. Pp. 485–517. DOI:https://doi.org/10.1007/978-1-48424470-8_38.



