
Введение
В рамках проекта был выполнен анализ данных о природных катастрофах во Вьетнаме на основе набора Mass Disasters in Vietnam с платформы Kaggle. Исследование охватывает период с 1953 по 2024 год и направлено на выявление закономерностей в частоте возникновения катастроф, их сезонности, а также масштабов человеческих и экономических потерь в зависимости от типа события.
В 2025 году страна вновь оказалась в центре внимания из-за серии тайфунов и наводнений, которые привели к значительным человеческим и экономическим потерям. Это послужило отправной точкой для анализа исторических данных с целью понять:
- как часто происходили подобные события в прошлом, - как менялось их количество со временем, - какие типы катастроф оказываются наиболее разрушительными.

В работе используются разные типы визуализаций: Линейный график — для анализа динамики катастроф по годам Круговая диаграмма — для структуры типов катастроф Столбчатые и горизонтальные графики — смертность и экономический ущерб. Тепловая карта — сезонные закономерности по месяцам и типам. Разные виды графиков позволяют всесторонне изучить данные и выявить скрытые закономерности.
Этапы работы
Для работы с данными были подключены библиотеки: Pandas — для анализа и обработки данных, Matplotlib (включая модули для работы с цветами и шрифтами) — для визуализации, а также инструменты Google Colab — для загрузки файлов.
Сначала загружается и подключается шрифт, затем — данные в формате CSV, которые считываются в датафрейм
Очистка и фильтрация данных
Очистка и фильтрация данных — приведение ключевых столбцов к числовому типу, замена некорректных значений на NaN, заполнение пропусков нулями и отбор записей за период 1953–2024 гг.
Визуализации
Строим линейный график, показывающий динамику числа природных катастроф во Вьетнаме по годам за период 1953–2024. На основе очищенных данных подсчитывается количество событий в каждом году
Создаем кольцевую (донат) диаграмму, отображающую распределение катастроф по типам за 1953–2024 годы. Визуализируются топ-5 наиболее частых типов, остальные объединены в категорию «Прочие». Диаграмма использует заданную цветовую палитру, выделяет самый распространённый тип лёгким смещением и отображает проценты белым жирным шрифтом поверх сегментов.
Строим столбчатую диаграмму, показывающую общее число погибших по типам катастроф (топ-8). Цвет каждого столбца плавно меняется от светлого к тёмному в зависимости от масштаба трагедии — самые смертоносные типы выделены тёмным акцентным цветом. Подписи и заголовок оформлены крупным шрифтом, сетка отключена для чистоты композиции.
Создаем горизонтальную столбчатую диаграмму, отображающую топ-10 типов катастроф с наибольшим экономическим ущербом (в тыс. долларов США, с поправкой на инфляцию).
Строим тепловую карту, показывающую распределение числа катастроф по месяцам и типам. Каждая ячейка отражает частоту событий: чем темнее цвет, тем больше катастроф. График наглядно выявляет сезонность: например, тайфуны и наводнения чаще происходят с июля по ноябрь, что соответствует муссонному сезону во Вьетнаме.


Применение ИИ
Leonardo.ai — для генерации визуальных изображений и иллюстраций;
Qwen-Chat — для генерации текстовых идей и рекомендаций по стилизации визуализаций.