課題7:不動産屋になろう

ソースコード(無駄あり)


  1. import pandas as pd # データ分析に用いるライブラリ
  2. import matplotlib.pyplot as plt # グラフ表示に用いるライブラリ
  3. pd.set_option('display.unicode.east_asian_width', True) # 表示のずれを少し緩和
  4. plt.rcParams['font.family'] = 'IPAexGothic' # グラフ表示におけるフォントの指定
  5. data_path = "data.csv"
  6. df_data = pd.read_csv(data_path, encoding="utf-8-sig")
  7. print(df_data.sample(10))
  8. print(df_data.shape)
  9. print(df_data.columns)
  10. print(df_data.describe())
  11. print(df_data.sort_values(by="路線", ascending=True))
  12. print(df_data.groupby("路線").mean())
  13. print(df_data["乗換時間"].value_counts(sort=False))
  14. print(df_data["路線"].value_counts(sort=False))
  15. df_count = df_data["路線"].value_counts(sort=False)
  16. df_count.plot.line()
  17. plt.show()
  18. df_mean = df_data.groupby("路線").mean()
  19. x = df_mean.index
  20. y = df_mean.loc[:, "家賃"]
  21. plt.bar(x, y)
  22. plt.xlabel("")
  23. plt.ylabel("家賃")
  24. plt.xticks(rotation=90)
  25. plt.show()
  26. df_mean = df_data.groupby("路線").mean()
  27. x = df_mean.index
  28. y = df_mean.loc[:, "乗換時間"]
  29. plt.bar(x, y)
  30. plt.xlabel("")
  31. plt.ylabel("乗換時間")
  32. plt.xticks(rotation=90)
  33. plt.show()
  34. df_mean = df_data.groupby("路線").mean()
  35. x = df_mean.index
  36. y = df_mean.loc[:, "乗換時間"]
  37. plt.bar(x, y)
  38. plt.xlabel("")
  39. plt.ylabel("乗換時間")
  40. plt.xticks(rotation=90)
  41. plt.show()
  42. mask = df_data.loc[:, "路線"] == "JR東海道本線"
  43. x = df_data[mask].groupby("駅").mean().loc[:, "合計時間"]
  44. y = df_data[mask].groupby("駅").mean().loc[:, "家賃"]
  45. plt.scatter(x, y, s=100, alpha=0.2)
  46. for xx, yy, ss in zip(x, y, x.index):
  47.     plt.text(xx, yy, ss)
  48. plt.xlabel("合計時間")
  49. plt.ylabel("家賃")
  50. plt.show()
  51. mask = df_data.loc[:, "路線"] == "小田急線"
  52. x = df_data[mask].groupby("駅").mean().loc[:, "合計時間"]
  53. y = df_data[mask].groupby("駅").mean().loc[:, "家賃"]
  54. plt.scatter(x, y, s=100, alpha=0.2)
  55. for xx, yy, ss in zip(x, y, x.index):
  56.     plt.text(xx, yy, ss)
  57. plt.xlabel("合計時間")
  58. plt.ylabel("家賃")
  59. plt.show()
  60. mask = df_data.loc[:, "路線"] == "JR南武線"
  61. x = df_data[mask].groupby("駅").mean().loc[:, "合計時間"]
  62. y = df_data[mask].groupby("駅").mean().loc[:, "家賃"]
  63. plt.scatter(x, y, s=100, alpha=0.2)
  64. for xx, yy, ss in zip(x, y, x.index):
  65.     plt.text(xx, yy, ss)
  66. plt.xlabel("合計時間")
  67. plt.ylabel("家賃")
  68. plt.show()

路線ごとの平均家賃や乗換時間を調べ、おすすめの駅を見つけることにした。
条件→家賃7万円以下、所要時間50分以内、2路線以上。

ここから路線を絞り、JR南武線にした。

南武線の各駅ごとの散布図を出してみた。これだけでは登戸駅がおすすめの駅だとは言い難い。
・小田急線が通っている(快速列車が止まる、行動範囲が広がる)
・東京都に近い(より賃金が高い所へ出稼ぎができる、新宿に行きやすい)
・ドラえもんの世界観がある。
・治安が良い→家族や女性の一人暮らしでも安心。
発表ppt(PDF)
デザイン演習1・2トップページ
XBPトップページ