
Концепция
Для меня всегда было интересно, насколько феномен судьбы реален, можно ли «пачкать» карму, в особенности всегда мучал вопрос, насколько можно предугадать «несчастливый» самолет, или несчастный случай от меня никак не зависит? При поиске датасета, я остановилась на статистике авиакрушений. Я часто летаю и я выберу этот датасет для анализа.
Типы созданных графиков
1. Круговая диаграмма с интерактивными элементами (библиотека plotly.express) 2. Столбчатый график 3. Хороплет для визуализаций локации 4. Сабплот для визуализации нескольких признаков попарно между собой 5. Гоуплот (фигура Pie)
Этапы работы
Этапы работы: 1. Выбор данных, которые интересно проанализировать, предобработка данных 2. Анализ данных 3. Визуализация Оформление графиков: В оформлении графиков я использовала серые градиенты как метафору на траурность.
Описание датасета
The available dataset is about Airplane Crashes throughout the world since 1908. Датасет об авиакатастрофах мира с 1908 года.
Сделаю общую предобработку (импорт библиотек, анализ, препроцессинг и т. д.)



Много пропущенных значений, и тут я подумала, а почему бы не начать визуализацию параллельно преобработке.
Для визуализации выберу серые оттенки, так как они о траурности, а авиакатастрофы это и вправду что-то в разрезе титанически ужасного, я попросила ChatGpt «преобразовать строку моего кода в визуализацию данных в серых оттенках, напиши код для хитмэпа, чтобы задействовать градацию серого"(промт). Да, я выбрала для этого хитмэп, так как он более релевантен
Теперь выделю топ_5, используя те же цвета, используя пай чарт, так как он удобный в рассмотрении и анализе небольшого количества признаков, попросила ChatGpt «написать код с теми же признаками, но изменить тип графика на круглый и интерактивный и в разных оттенках серого"(промт)


Приступим к чистке и дальнешей предобработке, поменяю информацию о дате на корректную запись
Поделю название компаний и заполню пропуски
Настало время анализа по признакам, выберу локацию и кол-во происшествий, чтобы проверить теорию о Бермудском треугольнике
Теория не подтвердилась, а вот факт про Москву стал тревожить
Итоги
Пассажиры и погибшие: В среднем, на борту разбившегося самолета было около 27 человек, из которых около 20 погибли. В некоторых случаях на борту находилось до 644 человек, а число погибших достигало 583. Наземные жертвы: В среднем, сообщалось о 1,6 наземных жертвах. Один инцидент отличался необычайно высоким числом — 2 750 наземных погибших. Месяц и год: Аварии в наборе данных происходили в период с 1908 по 2009 год, при этом средним месяцем для аварий был июнь. Охват годов в наборе данных позволяет проводить потенциальный анализ тенденций аварий во времени. Оператор, тип и производитель: Набор данных предоставляет информацию о наиболее распространенных операторах, типах воздушных судов и производителях, участвовавших в авариях. Например, «Американская воздушная почтовая служба» имела наибольшее число происшествий — 26, а модель «De Havilland DH-4», производимая «De», также имела 26 происшествий. Эти сведения могут помочь выявить закономерности или сосредоточить дальнейший анализ на конкретных операторах, типах или производителях.
Построим теперь географический график, которые будет интерактивный и группирующий локацию и тип происшествия
Попрошу ChatGpt «преобразовать анализ в визуализацию на карте, используя модуль choropleph"(промт), выбрала этот модуль, так как это наиболее показательно и понятнее для восприятия + логично для анализа с признаком по локации


Теперь топ30 по локации + количества происшествий, выбираю круглую интерактивную диаграмму, так как она интересней в визуализации, к тому же использование градиента серого упрощает восприятие, я попросила ChatGpt «из моего кода (нижняя ячейка) сделать визуализацию круглой интерактивной диаграммы в серых цветах"(промт)
Самое страшное — узнать, какая авиакомпания самая небезопасная, построю для этого обычный бар чарт, но добавлю интерактивность с помощью ChatGpt «сделай из моего стобчатого графика интерактивный в серых оттенках"(промт)
О, нет, только не Аэрофлот!!!!!
Напоследок, посмотрю зависимости типов катастроф (в небе/на земле), даты, года, фатальности. попрошу ChatGpt «написать код для нескольких зависимостей ('Aboard', 'Fatalities', 'Ground', 'Month', 'Year') в серых оттенках"(промт)
Итак, анализ данных об авиакатастрофах предоставили ценные сведения о факторах, способствующих таким инцидентам.
Очевидно, что непрерывные усилия по сбору данных, анализу и внедрению мер безопасности имеют решающее значение для смягчения рисков, связанных с авиаперевозками. Используя выводы, полученные в результате анализа авиакатастроф, авиационная отрасль может работать над улучшением протоколов безопасности, обучением, процедурами технического обслуживания и технологическими достижениями для обеспечения более безопасного будущего авиаперевозок. Полученные в ходе этого анализа выводы несомненно сыграют жизненно важную роль в определении направления развития авиационной безопасности в будущем, надеюсь я смогла внести вклад в предотвращение «несчастных» рейсов
Я использовала ChatGPT 4