Як міхуровий сюжет розкриває найкращі міста для життя в США

У цій статті я покажу вам кілька захоплюючих фактів про американські міста, значення міхурних сюжетів для вирішення в якому місті жити та як їх створити.

Ви думаєте про інвестиції в нерухомість у 2018 році? Переїзд у нове місто? Розглядаючи ці рішення, потрібно зважувати різні фактори, такі як рівень безробіття, ціна на житло, розмір міста, безпека тощо. Навіть з усіма цими даними та чотирма відповідними смужковими діаграмами, ви все одно будете неосвічені, дивлячись на цю таблицю. Ви спробуєте знайти найкращих кандидатів, але ці фактори розповідають різні історії ... Звучить як складна проблема.

Отже, чи є спосіб ми візуалізувати всі ці фактори в 1 діаграмі та порівняти їх ВСІ? Так, ми можемо використовувати міхурний сюжет!

Що таке бульбашковий сюжет?

Діаграма бульбашок - це тип діаграми, який відображає більше двох вимірів даних (порівняно з традиційними графіками розкидання). Крім побудови крапки на площині X-Y, вона використовує розмір, колір або форму точки для відображення більшої кількості розмірів.

Ми використовуємо рівень безробіття як вісь X, середню ціну житла як вісь Y, а населення міст як розмір крапок. Це робить хороший третій вимір. Колір довільно присвоюється кожному місту.

Найкраще місто в США, де можна жити - це… (чекай)

Переможець: Нашвілл!

Інші рекомендації: Остін, Омаха, Мілуокі, Даллас, Міннеаполіс, Денвер та Аврора.

У них низький рівень безробіття (і тому більше шансів знайти роботу) та низька ціна на житло, оскільки вони знаходяться в нижній лівій частині ділянки. Що це означає?

Це означає, що ви можете робити вибір на основі цього сюжету.

Наприклад, якщо ви вважаєте, що рівень безробіття є більш важливим і не заперечуєте проти підвищення цін на житло, то Гонолулу, Окленд, Бостон та Сан-Дієго є сильними кандидатами

Що з додаванням безпеки як іншого чинника?

Звичайно. Додамо безпеку як четвертий фактор (інші три фактори - це все ще ціна на житло, рівень безробіття та кількість населення). Замість того, щоб довільно призначити колір для міста, ми використовуємо кольорову шкалу для злочинності (рівень злочинності на 100 000 людей). Червоний означає більше злочину, а синій - менше.

Чи змінюється результат?

Так і було! Якщо безпека дуже важлива для вас, то Мілуокі може бути не таким чудовим вибором серед попередніх рекомендацій (навіть якщо це в нижній лівій частині графіка).

Тепер ви бачите силу ділянки бульбашки: здатність демонструвати кілька факторів в одному двовимірному графіку. Якщо у вас є лише діаграми для цих факторів, вам важко визначити міста з ідеальною комбінацією факторів. Сюжет бульбашок в основному створив для вас "візуальну функцію" для оптимізації багатозмінної проблеми прийняття рішень.

Як з часом змінюються рівень безробіття та ціни на житло?

Ми можемо створити інтерактивну графіку руху, щоб додати час як вимір (2013-2017 рр.), Щоб побачити, як змінюються фактори для цих міст з часом.

Щоб уникнути занадто багато візуальної інформації, я не використовував дані злочинів і використовував різні кольори для відображення кількох вибраних міст.

Хороша новина полягає в тому, що рівень безробіття майже в усіх містах значно зменшився (рухаючись справа наліво). Але погана новина полягає в тому, що ціни на житло зростають досить швидко (особливо це стосується Сан-Франциско, Сан-Хосе, Лос-Англе, Нью-Йорку та Сіетлі).

Хочете створити діаграми самостійно? Ось мій код для бульбашкових сюжетів та графік руху в Р. Весело граючи з сюжетами :)

################
# Пузир #
################
бібліотека (таблиця даних)
бібліотека (ggplot2)
бібліотека (ггрепель)
bubble_data <-fread ("https://raw.githubusercontent.com/zhendata/Medium_Posts/c007346db1575aca391a6623c87bb5a31a60b365/bubble_plot_merged_city_data.csv", sep = ",")
bubble_plot <- ggplot (bubble_data,
               aes (x = безробіття_ціна, y = домашня_ціна / 1000)) +
geom_point (aes (розмір = Населення, заливка = Total_Crime), форма = 21) +
# Створити "Bubble", призначивши розмір змінної #
scale_fill_continuous (низький = "# 33FFFF", високий = "# FF6699") +
scale_size_area (max_size = 20) +
# Вибір шкали кольорів міхура та максимального розміру міхура #
geom_text_repel (
          aes (label = City), nudge_x = 0, nudge_y = 0,75, розмір = 6) +
# Використовуйте geom_text_repel, щоб відштовхувати етикетки один від одного #
topic_bw () +
# Використовуйте білий фон замість сірого за замовчуванням #
ggtitle ("Найкращі міста США для проживання") + лабораторії (x = "Рівень безробіття,%", y = "Ціна на дому",
       size = "Населення", fill = "Злочин") + тема (plot.title = element_text (size = 25, hjust = 0,5),
        axis.title = element_text (розмір = 20, обличчя = "жирний"),
        axis.text = element_text (розмір = 15)) +
# Назва стилю та вісь #
scale_y_continuous (name = "Ціна для дому", перерви = seq (0, 1500, на = 250),
                      мітки = c ("0", "250K", "500K", "750K", "1000k", "1250k", "1500K"))
# Зробіть вісь y більш зрозумілою, замінивши наукове число на "K" #
друк (bubble_plot)
#################
# Графік руху #
#################
бібліотека (таблиця даних)
бібліотека (googleVis)
motion_data <-fread ("https://raw.githubusercontent.com/zhendata/Medium_Posts/c007346db1575aca391a6623c87bb5a31a60b365/motion_chart_merged_city_data.csv", sep = ",")
motion_chart <- gvisMotionChart (motion_data,
idvar = "Місто",
timevar = "Рік",
xvar = "Рівень безробіття",
yvar = "Головна ціна",
sizevar = "Населення")
сюжет (motion_chart)
# R автоматично відкриє вкладку у веб-переглядачі
# Флеш-плеєр потрібно включити в браузері
Клацніть піктограму “⌽”, щоб увімкнути Flash
########
# Дані #
########
"" "
Я використовував набори даних із Zillow (середнє житло), програми UCR UCR, census.gov (населення), Бюро праці (безробіття).
Я здійснив чистку даних та приєднався до потрібного мені формату в цій статті, і ви можете натиснути посилання нижче, щоб завантажити.
"" "
bubble_plot_merged_city_data.csv, motion_chart_merged_city_data.csv

Слідуйте за мною і дайте мені кілька хлопців, якщо ви вважаєте це корисним!

Ви також можете прочитати мої попередні статті про науку про дані, нерухомість та прийняття рішень: