
Описание
В своём проекте я провожу анализ компьютерных игр. С помощью кода и графиков я рассмотриваю различные аспекты игровой индустрии, выявляя закономерности и тенденции.
Компьютерные игры — это не просто развлечение. Это отражение нашего времени, зеркало, показывающее, как мы думаем, как мы взаимодействуем с миром, какие истории мы хотим рассказывать.
Используемые графики: — Гистограммы: для демонстрации распределения игр по жанрам, по годам выпуска, по рейтингам. — Диаграммы: для сравнения популярности платформ, разработчиков, жанров. -Интерактивные графики: для создания более динамичной и удобной визуализации данных.
Этот проект позволит:
- Получить глубокое понимание динамики и тенденций в игровой индустрии. - Визуализировать результаты анализа для удобного восприятия и представления.
Общая информация





Предобработка
Приведение названий. Изменение типов данных и частичная работа с пропусками. Series 'year'. Series 'rating'.
Добавим новые столбцы
Local garbage collector
Вывод по предобработке
Выполнено: Загрузка нужных библиотек Создание датафрейма Изучение информации Приведение информации к нижнему регистру Столбец 'year': переименование, работа с пропусками, изменение типа. Столбец 'rating': обработка пропусков, изменение рейтинга на возрастные ограничения, переименование, смена типа. Подсчет сумм продаж по регионам, создание новых колонок Подсчет сумарных продаж в мире для каждой строки Garbage collector: дроп лишних строк, переменных и значений, обновление индексов. Инфа по оставшимся строкам
Предоставлены: 16 000 строк Информация об играх для разных платформ проданых с 1980 по 2016 Суммы продаж в 4 условных регионах: NA, EU, JP, остальной мир 2 субъективные оценки: критиков и юзеров
Категориальные данные:
name platform genre rating
Числовые данные: year na_sales eu_sales jp_sales other_sales total_sales critic_score user_score age_min na_sum eu_sum jp_sum other_sum user_score содержит tbd — to_be_defined (данные будут подгружены)
Пропуски по столбцам name удалены, так как не могут быть восстановлены. Пропуски по году релиза и платформе по возможности восстановлены. Пропуски для рейтинга подтянуты 2 методами:
1. по имени игры с другой строки 2. по группировке имени с присвоением жанра
Пропуски колонок оценок и продаж удалены (после извлечения полезной информации для пропусков из других колонок) по логике: строки с продажей суммой меньше .04 по всем регионам и пропусками одновременно по 3 колонкам (rating, user_score, critic_score). На основе строки рейтинга создана колонка возрастных ограничений (равномерное непрерывное распределение)
Анализ данных
В начале выполним проверку актуальности данных по году релиза. ESRB начал деятельность в 1994, а до этого индустрия почти не регламентировалась. Научно-технический прогресс поставил производство на поток также с этого времени. Проверим предположения. В случае невостребованности выкинем лишние данные. Новый пункт Новый пункт
Примечание: самописный мини garbage collector избавил нас от лишних значений, значит данные максимально актуализированы (потери составили 42%).
На графиках видна «сезонность» приставок. Геймдевы меняют ориентир разработки на новые консоли, игровые движки и прочие технологии, это естественный процесс. В этой связи список из 7 консолей остается, но более старые версии PS3 и X360 под вопросом, им более 10 лет.
Анализ игр по жанрам
Агрегируя полученную информацию можно сделать вывод, что любимыми играми пользователей являются: шутеры экшены спортивные ролевые Они самые тирражируемые и прибыльные, остаются актуальными даже при большом выборе предложений.
Максимальная же выгода для магазина прячется в других жанрах. При минимальном количестве релизов показывают рекордные продажи: симуляторы стратегии приключенческие файтинги платформеры рейсинг
Худшими в рейтинге остался: пазл
Local garbage collector
Портрет пользователя по региону Северная Америка (NA)