Original size 1240x1750

Анализ дорожных происшествий

PROTECT STATUS: not protected
5

Описание

Для исследования я использовала набор данных о дорожно-транспортных происшествиях, которые я нашла на платформе Kaggle в наборе Traffic Accidents. Этот датасет содержит подробную информацию по каждой аварии — дату и время случившегося, погодные условия, состояние дорожного покрытия, наличие освещения, число задействованных транспортных средств, количество пострадавших, степень тяжести травм и другие важные параметры.

Несмотря на то что тема дорожно-транспортных происшествий является довольно сложной и даже трагичной, мне понравился этот датасет. Он оказался очень информативным и позволил глубже понять, какие факторы чаще всего приводят к авариям. Особенно интересно было видеть, как человеческий фактор — например, невнимательность или нарушение правил — взаимодействует с внешними условиями, такими как погода или время суток.

Мне понравилось, что данные хорошо структурированы и охватывают сразу несколько аспектов ДТП: от погодных условий до времени происшествий и их основных причин. Благодаря этому можно не просто исследовать статистику, но и сделать выводы, которые потенциально могут помочь в повышении безопасности на дорогах.

big
Original size 1536x1024

В ходе анализа датасета я посчитала наиболее подходящими следующие виды графиков:

[01] Круговая диаграмма — для наглядного представления распределения погодных условий при ДТП. [02] Гистограмма — для изучения часового распределения аварий по 24-часовому циклу. [03] Линейный график — для анализа сезонной динамики числа ДТП по месяцам. [04] Горизонтальная столбчатая диаграмма — для выделения топа основных причин аварий по частоте. [05] Групповой столбчатый график — для сравнения процентного распределения уровней тяжести травм днём и ночью.

В своём проекте я использовала: pandas — для загрузки, очистки и трансформации данных в удобные табличные структуры (DataFrame); matplotlib.pyplot — для построения базовых графиков и тонкой настройки их элементов (ось, подписи, легенда и т. д.); seaborn — поверх matplotlib для быстрого создания стильных, информативных диаграмм с развёрнутой палитрой и встроенными статистическими элементами.

Original size 1920x1080

Этапы работы

Для создания цветовой палитры диаграмм были использованы оттенки красного, тесно связанные с риском и опасностью, и символизирующие предупреждение и необходимость остановки.

Original size 1920x1080
Original size 1920x1080

Загрузка датасета и предобработка данных

[1] Погодное распределение ДТП

Анализируя распределение погодных условий при ДТП, я убедилась, что, вопреки распространённому мнению, подавляющее большинство аварий (76,9%) происходит в ясную, сухую погоду. На втором месте по частоте — дождь с долей 11,2%, а снег и облачность занимают лишь 3,9% и 3,6% соответственно. Остальные состояния, включая «неизвестно», вместе составляют менее 5% всех случаев. По моему мнению, это подчёркивает, что главная опасность на дороге — не экстремальные погодные явления, а невнимательность и несоблюдение правил даже при, казалось бы, идеальном покрытии.

Original size 989x790
Original size 1920x1080

[2] Гистаграмма распределения ДТП по часам в сутках

При анализе часового распределения ДТП оказалось, что аварии случаются неравномерно: утренний «пиковый» период (7–9 ч) и вечерний «час пик» (15–17 ч) дают заметно больше инцидентов, чем другие часы. В утренние часы количество ДТП поднимается с ~2 000 случаев в 5 ч до ~10 000 в 8 ч, а утром пик приходится на 8 ч. Ещё более выражена вечерняя волна: с 13 ч аварий становится всё больше, достигая максимума в 16 ч (около 14 000 случаев), и остаётся высоким до 18 ч. В ночные и ранние утренние часы (0–5 ч) число ДТП значительно ниже — порядка 2–4 тыс., что подчёркивает влияние трафика и интенсивности движения в часы коммерческого и школьного пика.

Original size 872x552
Original size 1920x1080

В дополнение к предыдущему графику я разбила его по признаку «будни-выходные». В будние дни распределение аварий проявляет чётко выраженную двухволновую структуру, обусловленную пиковыми нагрузками на утренние и вечерние часы в связи с массовыми поездками на работу и обратно. В противоположность этому в выходные наблюдается более ровное, монотонное распределение событий: интенсивность аварий плавно повышается в светлое время суток и постепенно снижается с наступлением темноты, без отчётливых всплесков. Данный контраст указывает на то, что в будние дни ДТП в значительной мере детерминируются регламентированными маршрутами и временем поездок, тогда как в выходные трафик распределяется более непринуждённо и равномерно.

Original size 713x470
Original size 1920x1080

[3] График распределения ДТП по месяцам

После детального рассмотрения суточных и недельных паттернов аварий перейдём к сезонному анализу. На линейном графике видно, что наименьшее количество ДТП приходится на конец зимы — февраль–март, когда интенсивность дорожного движения традиционно снижается из-за холода и неблагоприятных условий. Затем с весны начинается постепенный рост: уже в мае–июне число аварий стабильно превышает 15 000, что связано с увеличением мобильности и теплой погодой. Пик регистрации ДТП наблюдается в октябре — около 18 000 случаев, вероятно, из-за ухудшения видимости и повышенной влажности, а к концу года в декабре наблюдается вторичный подъём, обусловленный праздничным трафиком. Таким образом, сезонность явно проявляет свой вклад в интенсивность аварий: минимум в глубокой зиме, плавный рост в тёплое время и максимум в период переходной осенней погоды.

Original size 717x475
Original size 1920x1080

[4] Диаграмма основных причин ДТП

Чаще всего аварии происходят из-за того, что водители не уступают дорогу, в результате чего происходит ДТП. На втором месте — когда едут буквально впритык к впереди идущему авто, не оставляя запаса для экстренного торможения. Третья частая ошибка — попытки проскочить на красный или игнорировать светофор. Ещё нередко водители внезапно поворачивают без включённого поворотника или не сбрасывают скорость при приближении к препятствию, что тоже приводит к серьёзным последствиям.

Original size 989x590
Original size 1920x1080

[5] График распределения травм по погодным условиям и времени суток

Я проанализировала диаграмму и заметила, что ночью аварии всегда чуть более травмоопасны. Даже в ясную погоду среднее число травм растёт с примерно 0,4 днём до почти 0,5 ночью. Аналогичная история наблюдается в облачную и дождливую погоду — ночные столкновения приносят больше травм, чем дневные. Интересно, что при снегопаде разница тоже не заглушается, а в остальных условиях ночные аварии и вообще вдвое чаще заканчиваются травмами, чем днём. В общем, независимо от погоды, поездка в темноте оказывается более опасной.

Original size 691x562
Original size 1920x1080

Вывод

ДТП чаще всего происходят в дневное время, при хорошей погоде, и в будние дни, что указывает на человеческий фактор как основную причину аварий. Основные источники риска — нарушения правил дорожного движения, спешка и невнимательность. Меры по повышению безопасности должны быть сосредоточены на обучении водителей, усилении контроля за соблюдением ПДД и управлении транспортными потоками в часы пик.

Анализ дорожных происшествий
5
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more