[id_2[id_8158051[id_1650972457]]23277019]id_1400958910]
为啥用DeepSeek做预测
我曾经试过许多 AI 模型,像 GPT 之类的,还有文心一言等。然而在数据分析这方面,DeepSeek 更为擅长。它不但能够理解我所输入的各种复杂的经济指标,还能够自行去探寻一些我未曾想到的关联因素。用它来对房价走势进行预测,就仿佛请来了一个经济学教授与数据分析师的组合。并且这位“教授”不会感到困倦,也不会心生厌烦,无论想问什么都可以问。
数据准备很关键
做这种预测,第一步是进行数据准备。我收集了过去 10 年的房价数据,还收集了人口流动数据、GDP 增长数据、土地出让金数据以及城市发展规划等各种指标。之后,我将这些数据整理成 CSV 文件,并喂给 DeepSeek。
import pandas as pd
import numpy as np
# 读取城市房价历史数据
city_data = pd.read_csv('city_house_price_2015 到 2024 年的相关数据保存在 csv 文件中。')
# 数据预处理
city_data['人口净流入率'] = city_data['人口流入'] - city_data['人口流出']
city_data['供需比'] = city_data['新房供应量'] / city_data['购房需求量']
city_data['地方债务率'] = city_data['地方政府债务'] / city_data['地方GDP']
# 打印数据前5行看看
print(city_data.head())
温馨提示:数据质量会对预测准确度产生直接影响。我特意找出了人口老龄化、生育率、产业结构这些指标,这些指标看似与房价关系不大,但实际上它们的影响非常大。
设计巧妙的提示词
与 AI 模型进行交流时,提示词的设计至关重要。我察觉到许多人只是随意抛出一个问题,比如“预测一下房价”,如此一来,所得到的回答必然是不可靠的。
我的提示词是这样设计的:
根据我所提供的 2015 年至 2024 年各城市的房价、人口、经济等数据,分析以下这些因素对 2025 年房价所产生的影响。
1. 人口因素:流入流出趋势、老龄化程度、生育率变化
2. 经济因素:GDP增速、产业结构、就业质量、居民收入
3. 政策因素:调控政策、土地供应、金融政策、公共服务
4. 库存因素:存量房、空置率、供需比
5. 区域特点:城市定位、都市圈关系、区位优势
请特别关注以下信号:
- 人口持续净流出超过3年的城市
- 新房库存周期超过30个月的城市
- 地方政府债务率超过300%的城市
- 支柱产业衰退明显的城市
输出格式:
1. 全国房价整体趋势分析
2.可能出现房价明显下跌(超过 15%)的城市有 10 个,需要对这 10 个城市进行分析并找出原因。
3. 可能保持稳定或增长的10个城市,并分析原因
4. 对普通购房者的建议
分析结果有点扎心
DeepSeek 给出的分析既专业又扎心。全国呈现出整体分化更加明显的趋势,一二线城市或许会稳中有升,而大多数三四线城市仍在持续承受压力。不过,有 10 个城市被它预测可能暴跌超过 15%,这些城市主要包括:
人口流出严重的老工业城市
高度依赖房地产的单一产业城市
前几年房价虚高但经济基本面不支持的三线城市
大城市周边曾经被炒作的卫星城
旅游城市中过度开发的区域
我不会说出具体是哪 10 个城市,因为担心被人骂。这些城市要么不是你的家乡,要么不是我的家乡。
让模型解释预测逻辑
仅有结论是不够的,我让DeepSeek解释它的预测逻辑:
# 使用DeepSeek API获取详细分析
import requests
API_KEY = "your_api_key_here"
API_URL = 这是一个特定的链接,名为“https://api.deepseek.com/v1/chat/completions”,用于特定的通信或操作。它可能与某种聊天相关的功能或服务相关联,通过这个链接可以进行相关的交互和处理。
prompt = f"""
请详细解释为什么预测{city_name}可能出现房价下跌:
1. 哪些数据指标表现异常?
2. 这些指标之间的相关性分析
3. 历史上类似城市的先例
4. 预测的置信区间和可能的误差范围
"""
response = requests.post(
API_URL,
headers={"Authorization": f"Bearer {API_KEY}"},
json={
"model": "deepseek-chat",
"messages": [{"role": "user", "content": prompt}],
"temperature": 0.3,
"max_tokens": 1500
}
)
print(response.json()["choices"][0]["message"]["content"])
温馨提示:将 temperature 参数设定为 0.3,能够使 AI 输出更为保守且更具确定性的内容,降低“胡说八道”出现的可能性。
可视化让数据说话
仅看文字分析会略显枯燥,我借助 AI 生成了可视化代码,并且将预测结果制作成了图表。
import matplotlib.pyplot as plt
import seaborn as sns
假设 prediction_results 是 AI 预测的结果,其中包含城市名以及预测的跌幅。
prediction_results = {
'城市A': -18.5,
'城市B': -17.2,
# ... 其他城市数据
}
# 排序后绘制条形图
sorted_cities = dict(sorted(prediction_results.items(), key=lambda x: x[1]))
plt.figure(figsize=(12, 8))
colors = ['#FF5555' if v < -15 else '#FFAA55' if v < -10 else '#FFFF55' for v in sorted_cities.values()]
sns.barplot(x=list(sorted_cities.values()), y=list(sorted_cities.keys()), palette=colors)
plt.title('2025年预测房价变动率(%)', fontsize=16)
plt.tight_layout()
plt.savefig('house_price_prediction_2025.png' 这个文件名所代表的内容是关于房屋价格预测到 2025 年的相关信息。它可能是一张用于展示房屋价格预测结果的图片,也可能是与房屋价格预测相关的文件。通过这个文件名,我们可以大致了解到它与房屋价格预测在 2025 年这个时间节点上的联系。, dpi=300)
plt.show()
模型的局限性别忘了
这个预测好归好,但AI模型有它的局限性:
它只能基于历史数据预测,突发的黑天鹅事件根本预测不到
对新政策的理解可能不够及时和深入
模型或许存在偏见,尤其在训练数据中,如果某些城市的相关报道本身就带有偏见。
我特意询问了 DeepSeek 它所预测的不确定性的大小。它给出的置信区间让我感到十分惊讶,其中最乐观的预测和最悲观的预测相差将近 30 个百分点。
这提醒我们,AI 预测如同天气预报,仅可作参考,不可当作真理。对于买房这样的大事,AI 分析只能成为决策的一部分,还需将自己对生活需求、工作发展、家庭规划等方面结合起来进行综合考量。
意外发现的模式
分析过程中有个有趣的发现,一些三四线城市人口在减少,然而房价却很稳定。深入分析之后可以看出,这些城市具备两个共同的特点:其一,优质教育资源较为集中;其二,产业转型较为成功。
这提示我们,人口流出未必会致使房价暴跌。关键在于流出的是何种人,留下的又是何种人,同时城市的产业结构是否具备支撑作用。
我将 AI 的这些分析结果进行了整理,制作了一个查询工具。通过这个工具,输入城市名,就能够看到详细的分析和预测。这个工具挺好玩的,或许下次可以分享一下它的制作过程。
看完这些分析后,回头去看房地产市场,能够发现很多在表面现象背后的逻辑。或许,这就是用 AI 做预测所具有的最大价值。