Original size 2158x3040

Анализ базы данных кошек

PROTECT STATUS: not protected
The project is taking part in the competition

В рамках проекта были проанализированы данные из датасета породистых котов с сайта Kaggle. Котики, без преувеличения, самые популярные домашние животные, поэтому анализ пород будет особенно актуален для людей, которые только думают завести себе питомца.

Проект будет включать информацию о наиболее распространённых цветах среди пород, средней продолжительности жизни, соотношении полов и среднем весе для каждого вида. Это поможет потенциальным владельцам лучше знать своих питомцев.

Для визуализации были использованы: - круговая диаграмма; - гистограмма; - линейный график; - тепловая таблица.

Визуал

big
Original size 2333x751

Для оформления были выбраны цвета, встречающиеся в окрасе котов разных пород, они были сделаны яркими и контрастными для лучшей считываемости графиков.

Графики

Для начала работы данные таблицы Cats_dataset были импортированны и подготовлены для анализа.

import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns df = pd.read_csv ('cats_dataset.csv')

0

Для построения круговой диаграммы был использован метод расчёта процентного соотношения каждого цвета кошки породы Ангора. Далее была сделана визуализация, где каждая часть круга показывает, сколько процентов кошек существует определённого цвета.

С помощью этого вида диаграммы можно создать такую визуализацию для каждой породы, что наглядно продемонстрирует заводчикам популярность окраса котов.

0

Для следующей диаграммы использован метод подсчёта частот (количество кошек каждой породы), данные визуализированы в виде столбчатой диаграммы, где высота столбца отражает популярность породы. Также применён метод ранжирования — породы отсортированы по убыванию, что позволяет быстро выделить лидера и менее популярные варианты.

Потенциальным заводчикам эта диаграмма пригодится для оценки востребованности пород, можно сориентироваться на популярные варианты, если важна доступность котёнка или сообщество единомышленников, или обратить внимание на менее популярные породы, если хочется чего-то необычного.

0

На диаграмме использованы методы расчёта среднего веса в виде столбчатой диаграммы и среднего возраста в виде линейного графика по породам кошек. Данные разделены по породам, что позволяет сравнить характеристики разных групп.

Диаграмма пригодится для учета физических параметров животного: какие кошки в среднем крупнее/мельче по весу и дольше/короче живут, чтобы учесть особенности ухода, питания и возможные риски по здоровью, связанные с породой.

0

На гистограмме использованы методы подсчёта количества кошек каждой породы по полу и сравнительного анализа распределений: данные разделены по породам и визуализированы в виде сгруппированных столбцов, где высота столбца отражает численность кошек.

Потенциальным заводчикам эта диаграмма пригодится для оценки баланса полов среди кошек интересующей породы, чтобы понять, насколько легко будет найти котёнка нужного пола, и принять решение с учётом особенностей популяции, если важна возможность дальнейшего разведения.

0

В тепловой диаграмме использованы методы подсчёта количества кошек каждого окраса по полу и метод сравнительного анализа. Данные сгруппированы по цвету шерсти и разделены на категории самки/самцы. Визуализация выполнена с помощью цветовой кодировки.

Такая диаграмма, в отличие от круговой, сможет продемонстрировать популярность того или иного окраса среди всех пород и полов сразу, что наглядно продемонстрирует популярность цветов.

Вывод

Использование Python для построения диаграмм в данном исследовании показало высокую эффективность благодаря гибкости языка и библиотек pandas, которые позволили создать информативные визуализации и настраивать дизайн и цветовую схему. Такой подход дал возможность не только наглядно представить статистические данные о кошках, но и провести разного рода расчеты.

Описание применения генеративной модели

ChatGPT — консультация по написанию кода и его улучшению Leonardo.AI — генерация изображений проекта

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more