Original size 1140x1600

Анализ датасета из kaggle Airplane Crashes 🛫

PROTECT STATUS: not protected
4

Концепция

Для меня всегда было интересно, насколько феномен судьбы реален, можно ли «пачкать» карму, в особенности всегда мучал вопрос, насколько можно предугадать «несчастливый» самолет, или несчастный случай от меня никак не зависит? При поиске датасета, я остановилась на статистике авиакрушений. Я часто летаю и я выберу этот датасет для анализа.

Типы созданных графиков

1. Круговая диаграмма с интерактивными элементами (библиотека plotly.express) 2. Столбчатый график 3. Хороплет для визуализаций локации 4. Сабплот для визуализации нескольких признаков попарно между собой 5. Гоуплот (фигура Pie)

Этапы работы

Этапы работы: 1. Выбор данных, которые интересно проанализировать, предобработка данных 2. Анализ данных 3. Визуализация Оформление графиков: В оформлении графиков я использовала серые градиенты как метафору на траурность.

Описание датасета

The available dataset is about Airplane Crashes throughout the world since 1908. Датасет об авиакатастрофах мира с 1908 года.

Сделаю общую предобработку (импорт библиотек, анализ, препроцессинг и т. д.)

big
Original size 2878x308
big
Original size 2866x120
big
Original size 1806x880
Original size 2150x684
Original size 1264x546

Много пропущенных значений, и тут я подумала, а почему бы не начать визуализацию параллельно преобработке.

Для визуализации выберу серые оттенки, так как они о траурности, а авиакатастрофы это и вправду что-то в разрезе титанически ужасного, я попросила ChatGpt «преобразовать строку моего кода в визуализацию данных в серых оттенках, напиши код для хитмэпа, чтобы задействовать градацию серого"(промт). Да, я выбрала для этого хитмэп, так как он более релевантен

Original size 1338x174
Original size 2282x568

Теперь выделю топ_5, используя те же цвета, используя пай чарт, так как он удобный в рассмотрении и анализе небольшого количества признаков, попросила ChatGpt «написать код с теми же признаками, но изменить тип графика на круглый и интерактивный и в разных оттенках серого"(промт)

Original size 1368x466

Приступим к чистке и дальнешей предобработке, поменяю информацию о дате на корректную запись

Original size 862x138

Поделю название компаний и заполню пропуски

Original size 1746x718

Настало время анализа по признакам, выберу локацию и кол-во происшествий, чтобы проверить теорию о Бермудском треугольнике

Original size 1234x164
Original size 852x730

Теория не подтвердилась, а вот факт про Москву стал тревожить

Original size 1268x424
Original size 1522x1342

Итоги

Пассажиры и погибшие: В среднем, на борту разбившегося самолета было около 27 человек, из которых около 20 погибли. В некоторых случаях на борту находилось до 644 человек, а число погибших достигало 583. Наземные жертвы: В среднем, сообщалось о 1,6 наземных жертвах. Один инцидент отличался необычайно высоким числом — 2 750 наземных погибших. Месяц и год: Аварии в наборе данных происходили в период с 1908 по 2009 год, при этом средним месяцем для аварий был июнь. Охват годов в наборе данных позволяет проводить потенциальный анализ тенденций аварий во времени. Оператор, тип и производитель: Набор данных предоставляет информацию о наиболее распространенных операторах, типах воздушных судов и производителях, участвовавших в авариях. Например, «Американская воздушная почтовая служба» имела наибольшее число происшествий — 26, а модель «De Havilland DH-4», производимая «De», также имела 26 происшествий. Эти сведения могут помочь выявить закономерности или сосредоточить дальнейший анализ на конкретных операторах, типах или производителях.

Построим теперь географический график, которые будет интерактивный и группирующий локацию и тип происшествия

Original size 2004x174
Original size 1220x688
Original size 1208x140

Попрошу ChatGpt «преобразовать анализ в визуализацию на карте, используя модуль choropleph"(промт), выбрала этот модуль, так как это наиболее показательно и понятнее для восприятия + логично для анализа с признаком по локации

Original size 2376x154

Теперь топ30 по локации + количества происшествий, выбираю круглую интерактивную диаграмму, так как она интересней в визуализации, к тому же использование градиента серого упрощает восприятие, я попросила ChatGpt «из моего кода (нижняя ячейка) сделать визуализацию круглой интерактивной диаграммы в серых цветах"(промт)

Original size 1370x128
Original size 2786x918
Original size 1488x1144

Самое страшное — узнать, какая авиакомпания самая небезопасная, построю для этого обычный бар чарт, но добавлю интерактивность с помощью ChatGpt «сделай из моего стобчатого графика интерактивный в серых оттенках"(промт)

Original size 2502x776
Original size 2792x772

О, нет, только не Аэрофлот!!!!!

Напоследок, посмотрю зависимости типов катастроф (в небе/на земле), даты, года, фатальности. попрошу ChatGpt «написать код для нескольких зависимостей ('Aboard', 'Fatalities', 'Ground', 'Month', 'Year') в серых оттенках"(промт)

Original size 1342x202
Original size 2468x1230

Итак, анализ данных об авиакатастрофах предоставили ценные сведения о факторах, способствующих таким инцидентам.

Очевидно, что непрерывные усилия по сбору данных, анализу и внедрению мер безопасности имеют решающее значение для смягчения рисков, связанных с авиаперевозками. Используя выводы, полученные в результате анализа авиакатастроф, авиационная отрасль может работать над улучшением протоколов безопасности, обучением, процедурами технического обслуживания и технологическими достижениями для обеспечения более безопасного будущего авиаперевозок. Полученные в ходе этого анализа выводы несомненно сыграют жизненно важную роль в определении направления развития авиационной безопасности в будущем, надеюсь я смогла внести вклад в предотвращение «несчастных» рейсов

Я использовала ChatGPT 4

Анализ датасета из kaggle Airplane Crashes 🛫
4
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more