
Описание
Для исследования я использовала набор данных о дорожно-транспортных происшествиях, которые я нашла на платформе Kaggle в наборе Traffic Accidents. Этот датасет содержит подробную информацию по каждой аварии — дату и время случившегося, погодные условия, состояние дорожного покрытия, наличие освещения, число задействованных транспортных средств, количество пострадавших, степень тяжести травм и другие важные параметры.
Несмотря на то что тема дорожно-транспортных происшествий является довольно сложной и даже трагичной, мне понравился этот датасет. Он оказался очень информативным и позволил глубже понять, какие факторы чаще всего приводят к авариям. Особенно интересно было видеть, как человеческий фактор — например, невнимательность или нарушение правил — взаимодействует с внешними условиями, такими как погода или время суток.
Мне понравилось, что данные хорошо структурированы и охватывают сразу несколько аспектов ДТП: от погодных условий до времени происшествий и их основных причин. Благодаря этому можно не просто исследовать статистику, но и сделать выводы, которые потенциально могут помочь в повышении безопасности на дорогах.

В ходе анализа датасета я посчитала наиболее подходящими следующие виды графиков:
[01] Круговая диаграмма — для наглядного представления распределения погодных условий при ДТП. [02] Гистограмма — для изучения часового распределения аварий по 24-часовому циклу. [03] Линейный график — для анализа сезонной динамики числа ДТП по месяцам. [04] Горизонтальная столбчатая диаграмма — для выделения топа основных причин аварий по частоте. [05] Групповой столбчатый график — для сравнения процентного распределения уровней тяжести травм днём и ночью.
В своём проекте я использовала: pandas — для загрузки, очистки и трансформации данных в удобные табличные структуры (DataFrame); matplotlib.pyplot — для построения базовых графиков и тонкой настройки их элементов (ось, подписи, легенда и т. д.); seaborn — поверх matplotlib для быстрого создания стильных, информативных диаграмм с развёрнутой палитрой и встроенными статистическими элементами.
Этапы работы
Для создания цветовой палитры диаграмм были использованы оттенки красного, тесно связанные с риском и опасностью, и символизирующие предупреждение и необходимость остановки.
Загрузка датасета и предобработка данных
[1] Погодное распределение ДТП
Анализируя распределение погодных условий при ДТП, я убедилась, что, вопреки распространённому мнению, подавляющее большинство аварий (76,9%) происходит в ясную, сухую погоду. На втором месте по частоте — дождь с долей 11,2%, а снег и облачность занимают лишь 3,9% и 3,6% соответственно. Остальные состояния, включая «неизвестно», вместе составляют менее 5% всех случаев. По моему мнению, это подчёркивает, что главная опасность на дороге — не экстремальные погодные явления, а невнимательность и несоблюдение правил даже при, казалось бы, идеальном покрытии.
[2] Гистаграмма распределения ДТП по часам в сутках
При анализе часового распределения ДТП оказалось, что аварии случаются неравномерно: утренний «пиковый» период (7–9 ч) и вечерний «час пик» (15–17 ч) дают заметно больше инцидентов, чем другие часы. В утренние часы количество ДТП поднимается с ~2 000 случаев в 5 ч до ~10 000 в 8 ч, а утром пик приходится на 8 ч. Ещё более выражена вечерняя волна: с 13 ч аварий становится всё больше, достигая максимума в 16 ч (около 14 000 случаев), и остаётся высоким до 18 ч. В ночные и ранние утренние часы (0–5 ч) число ДТП значительно ниже — порядка 2–4 тыс., что подчёркивает влияние трафика и интенсивности движения в часы коммерческого и школьного пика.
В дополнение к предыдущему графику я разбила его по признаку «будни-выходные». В будние дни распределение аварий проявляет чётко выраженную двухволновую структуру, обусловленную пиковыми нагрузками на утренние и вечерние часы в связи с массовыми поездками на работу и обратно. В противоположность этому в выходные наблюдается более ровное, монотонное распределение событий: интенсивность аварий плавно повышается в светлое время суток и постепенно снижается с наступлением темноты, без отчётливых всплесков. Данный контраст указывает на то, что в будние дни ДТП в значительной мере детерминируются регламентированными маршрутами и временем поездок, тогда как в выходные трафик распределяется более непринуждённо и равномерно.
[3] График распределения ДТП по месяцам
После детального рассмотрения суточных и недельных паттернов аварий перейдём к сезонному анализу. На линейном графике видно, что наименьшее количество ДТП приходится на конец зимы — февраль–март, когда интенсивность дорожного движения традиционно снижается из-за холода и неблагоприятных условий. Затем с весны начинается постепенный рост: уже в мае–июне число аварий стабильно превышает 15 000, что связано с увеличением мобильности и теплой погодой. Пик регистрации ДТП наблюдается в октябре — около 18 000 случаев, вероятно, из-за ухудшения видимости и повышенной влажности, а к концу года в декабре наблюдается вторичный подъём, обусловленный праздничным трафиком. Таким образом, сезонность явно проявляет свой вклад в интенсивность аварий: минимум в глубокой зиме, плавный рост в тёплое время и максимум в период переходной осенней погоды.
[4] Диаграмма основных причин ДТП
Чаще всего аварии происходят из-за того, что водители не уступают дорогу, в результате чего происходит ДТП. На втором месте — когда едут буквально впритык к впереди идущему авто, не оставляя запаса для экстренного торможения. Третья частая ошибка — попытки проскочить на красный или игнорировать светофор. Ещё нередко водители внезапно поворачивают без включённого поворотника или не сбрасывают скорость при приближении к препятствию, что тоже приводит к серьёзным последствиям.
[5] График распределения травм по погодным условиям и времени суток
Я проанализировала диаграмму и заметила, что ночью аварии всегда чуть более травмоопасны. Даже в ясную погоду среднее число травм растёт с примерно 0,4 днём до почти 0,5 ночью. Аналогичная история наблюдается в облачную и дождливую погоду — ночные столкновения приносят больше травм, чем дневные. Интересно, что при снегопаде разница тоже не заглушается, а в остальных условиях ночные аварии и вообще вдвое чаще заканчиваются травмами, чем днём. В общем, независимо от погоды, поездка в темноте оказывается более опасной.
Вывод
ДТП чаще всего происходят в дневное время, при хорошей погоде, и в будние дни, что указывает на человеческий фактор как основную причину аварий. Основные источники риска — нарушения правил дорожного движения, спешка и невнимательность. Меры по повышению безопасности должны быть сосредоточены на обучении водителей, усилении контроля за соблюдением ПДД и управлении транспортными потоками в часы пик.