
Для анализа я выбрала готовые данные с сайта Kaggle.
Данные включают полную характеристику различных сортов сыра, а именно оригинальное название сыра, страну и регион его производства, название компании производителя, содержание в нем молока, жиров и кальция, его тип, вкус, цвет, текстуру, аромат, характеристику корочки, а также синонимы названия этого сыра. Анализ данных о сыре считаю актуальной и полезной информацией для людей, которые следят за своим питанием или имеют непереносимости определенных компонентов этого продукта.
Данные за 2024 год

вывод первых 10-ти строк таблицы для понимания общей структуры данных
Для визуального анализа я использовала преимущественно столбчатые диаграммы, так как объем данных достаточно большой, и при выводе первых 10 строк таблицы заметно, что данных с текстовыми характеристиками продукта значительно больше, чем числовых значений. А именно столбчатые диаграммы позволяют полностью прописывать необходимые текстовые характеристики таким образом, чтобы их было удобно считывать.
Обложка проекта
Для генерации обложки я воспользовалась нейросетью Ideogram.ai
Prompt: A minimalistic illustration featuring a cartoon slice of cheese, with a yellow and slightly off-white color scheme. The cheese sits atop a white plate. The background is a clean, white space, the focus on the slice of cheese., illustration.
Топ стран по производству сыра
Начинаю анализировать данные столбца «сountry» и нахожу 5 стран с самым большим количеством производимых сортов сыра, исходя из количества упоминаний страны в таблице. Больше всего различных видов производится в США, Франции, Италии, Канаде и Австралии.
Для стилизации данных я воспользовалась собственной палитрой цветов в желтых оттенках: #FFED2E, #ECE769, #FAF075, #FFE390, #F7F5CF
Цвет сыра
С помощью графика определяю, какое количество сыров определенного цвета существует на данный момент. Таким образом, можно отметить, что самым популярным цветом сыра, на удивление, считается «white», а оттенок «pale yellow» занимает уверенное второе место по популярности.
Процент содержания жира
Определяю количество сортов сыра с определенным процентом жирности. Так как анализируемых значений много, и при этом они указаны в разных величинах, лучше всего подойдет столбчатая диаграмма с большим спектром цветов. Исходя из анализа можно отметить, что 45% — самое часто встречающееся значение жирности сыра.
Сырная корочка
На круговой диаграмме ниже представлен процентный анализ количества видов сыра с определенным типом корочки (в зависимости от того, каким способом эта корочка была получена). Как можно заметить, 37% видов сыра имеют собственную натуральную корочку, а 20,4% совсем не имеют корочки.