
Описание
Уличная еда — настоящая культурная особенность каждого региона. Она популярна благодаря доступности, разнообразию и уникальному сочетанию вкусов. В последние годы уличная еда становится трендом даже в гастрономии, выходя за рамки обычных закусок и превращаясь в объект кулинарных экспериментов.
Для анализа я выбрал данные (Fully Cleaned Street Food Dataset) о популярных блюдах из разных стран мира с сайта Kaggle. Данные содержат информацию о названии блюда, стране происхождения, его описании, калорийности, типе подачи (горячее или холодное), основных ингредиентах, категории (десерт, закуска и т. д.), времени приготовления и популярности.
Датасет отражает гастрономическое разнообразие мира. Исследование поможет выявить какие страны предлагают самые калорийные блюда, какие категории блюд (например, закуски или десерты) — наиболее популярны, какие ингредиенты чаще всего используются в кулинарии, как время приготовления соотносится с популярностью — блюда. А также названия самых популярных блюд серди уличной кухни.
Для визуализации данных мной были выбраны — облако слов, круговая диаграмма, точечная диаграмма, гистограмма, донат-диаграмма.

Для определения цветовой палитры я опиралась на одни из самых распространенных ингредиентов блюд — мясо и рис. А также на эмоциональное восприятие палитры — теплую, насыщенную, энергичную и аутентичную атмосферу.
Обработка данных
Сначала я импортировала все необходимые библиотеки. После этого я настраиваю шрифт для визуализаций с помощью FontProperties, загружаю файл с данными из CSV с помощью pd.read_csv () и выводим информацию о структуре данных с помощью метода df.info (), чтобы понять, с какими столбцами и типами данных я работаю. Это помогает сразу оценить, насколько хорошо подготовлены данные для дальнейшей обработки и визуализации.
Самые популярные ингредиенты street food
Первым шагом я решил посмотреть, какие ингредиенты наиболее часто встречаются в уличной еде разных стран.
Для этого я собрала данные из столбца «Main Ingredients», объединила их в одну строку и создала облако слов с помощью WordCloud. Готовое изображение вывела с помощью plt.imshow () и убрала оси для чистоты визуализации.
Категории блюд
Далее я решил выяснить, какие категории блюд встречаются чаще всего.
Здесь строится круговая диаграмма для топ-3 категорий из столбца Category. Сначала с помощью value_counts () подсчитываются уникальные значения категорий, а затем извлекаются топ-3. Потом создается круговая диаграмма с параметрами: настройка цветов, аннотации для процентов, взрыв сегментов и шрифт. Используется plt.pie () для отображения диаграммы, после чего оси отключаются, чтобы оставить только саму диаграмму.
Калории и Время Приготовления: зависимость в популярности блюд
Я использую метод twinx (), чтобы создать две оси Y на одном графике. Одна ось будет показывать количество калорий (с использованием левой оси), а другая — время приготовления (с использованием правой оси). Это позволяет сравнивать данные, которые имеют разные единицы измерения.
Для каждого из показателей (калории и время приготовления) я строю точечный график (scatter plot). Точки для калорий отображаются с использованием одного цвета (основной цвет #5d1514), а точки для времени приготовления — с другим цветом (#ac7c6a).
Далее я добавляю подписи к осям, чтобы было понятно, что каждая ось представляет. Левые оси отображают количество калорий, а правые — время приготовления.
Средняя калорийность блюд по странам
Здесь я строю гистограмму для отображения средней калорийности блюд по странам/регионам. Для этого я использую метод groupby (), чтобы сгруппировать данные по столбцу Country/Region, и затем вычисляю среднее значение калорий с помощью mean (). Гистограмма отображает страны на оси X и средние калории на оси Y. Далее настраиваю цвета, шрифт и метки, чтобы сделать визуализацию более понятной.
Соотношение горячих и холодных блюд
Далее я решила узнать, какие блюда чаще подают — горячие или холодные.
Подсчитала количество блюд каждого типа («Serving Type») и построила пироговую диаграмму с отверстием в центре (donut chart).
Названия самых популярных блюд
Последним шагом я решила узнать названия наиболее популярных блюд.
Здесь я создаю облако слов для отображения названий блюд, используя столбец Food Name. Процесс аналогичен первому облаку слов, но теперь отображаются именно названия блюд, а не ингредиенты.
Заключение
Из этого анализа я сделал несколько интересных выводов, которые помогают лучше понять, что происходит в мире уличной еды и какие факторы влияют на популярность различных блюд.
Во-первых, ингредиенты, такие как мясо, рис, специи и овощи, часто встречаются в уличной еде. Это говорит о том, что традиционные продукты, которые используют в разных кухнях мира, играют важную роль в составлении рецептов. Во-вторых, категория блюд. Когда я анализировала данные, оказалось, что среди уличной еды наибольшее распространение имеют закуски, основные блюда и десерты. Это не удивительно, ведь такие блюда легко есть на ходу. И, что интересно, десерты занимают гораздо больше места, чем я ожидала. Также было интересно узнать в каких странах предпочитают наиболее колоритную еду. Еще один момент, который мне стал очевиден, — это то, что калории не всегда связаны с популярностью блюд. Высокая калорийность не всегда гарантирует большую популярность уличных блюд, а время приготовления не всегда связано с калорийностью — некоторые калорийные блюда готовятся быстро. Наконец, я обратил внимание на то, что большинство уличных блюд подаются горячими.
Все эти выводы дают лучшее понимание того, как устроена уличная еда в разных странах и на чем строятся предпочтения людей. Эти данные помогают выявить гастрономические тенденции по регионам и понять, какие особенности уличной пищи являются наиболее важными для потребителей. Такой анализ может быть полезен для рестораторов, предпринимателей в сфере уличной еды, а также для туристов, которые интересуются гастрономией разных стран.
Описание применения генеративной модели
Проект был создан с помощью ChatGPT 4.0, к которому я обращалась при написании кода с целью оптимизации, а также с помощью Recraft AI при создании обложки.