第 20 天:机器学习分类模型(逻辑回归 Classification)
太厉害了!你已经来到 ✅第 20 天:机器学习分类模型(逻辑回归 Classification) 🔥
这是你从“预测数值(回归)” → 进入 “智能判断(分类)” 的关键一天!
✅ 第 20 天学习目标
今天你将学会:
- ✅ 什么是 分类问题
- ✅ 什么是 逻辑回归(Logistic Regression)
✅ 什么是:
- 特征 X
- 标签 y(0 / 1)
- ✅ 用
scikit-learn训练分类模型 ✅ 做你人生第一个:
✅ “是否及格预测 AI”
- ✅ 学会
train_test_split(训练集 & 测试集)
一、什么是分类?(一句话秒懂)
| 类型 | 例子 | 输出 |
|---|---|---|
| 回归 | 预测成绩 | 85.6 |
| ✅ 分类 | 是否及格 | ✅及格 / ❌不及格 |
| ✅ 分类 | 是否垃圾邮件 | 是 / 否 |
| ✅ 分类 | 是否录取 | 是 / 否 |
💡 记住一句话:
✅ 分类 = 结果是“种类”,不是具体数值
二、逻辑回归是干什么的?
✅ 逻辑回归 = 最基础、最经典的二分类模型
专门用来解决:
- ✅ 是 / 否
- ✅ 0 / 1
- ✅ 通过 / 不通过
✅ 三、你的第一个分类 AI:是否及格预测系统
🎯 目标:
输入:学习小时数
输出:是否及格(1 = 及格,0 = 不及格)
✅ 1️⃣ 构造训练数据
import numpy as np
# 学习小时(特征 X)
X = np.array([
[1],
[2],
[3],
[4],
[5],
[6]
])
# 是否及格(标签 y)
# 0 = 不及格,1 = 及格
y = np.array([0, 0, 0, 1, 1, 1])✅ 2️⃣ 创建并训练逻辑回归模型
from sklearn.linear_model import LogisticRegression
model = LogisticRegression()
model.fit(X, y)✅ 3️⃣ 进行预测
hour = float(input("请输入学习小时数:"))
pred = model.predict([[hour]])
if pred[0] == 1:
print("✅ 预测结果:及格")
else:
print("❌ 预测结果:不及格")🎉 如果你这个程序能跑通:
✅ 恭喜你!你已经真正做出了【智能判断型 AI 程序】!
✅ 四、加入“训练集 & 测试集”概念(非常重要)
💡 为什么要分?
✅ 不能用“考试题”拿去当“练习题”
否则模型是在“背答案”,不是在“学习”
✅ 训练集 & 测试集拆分
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(
X, y, test_size=0.3
)✅ 用训练集训练,用测试集评分
model.fit(X_train, y_train)
score = model.score(X_test, y_test)
print("模型准确率:", score)✅ 输出示例:
模型准确率: 0.83✅ 五、一次完整“工业级分类流程”
你现在已经掌握完整流程:
1️⃣ 准备数据 X, y
2️⃣ 拆分训练集 & 测试集
3️⃣ 创建模型
4️⃣ 训练模型
5️⃣ 测试模型
6️⃣ 用模型预测新数据 ✅✅ 第 20 天综合实战项目(真实 AI 项目)
🎯 项目名称:
✅ 考试是否及格预测系统(AI 智能版)
✅ 项目要求
1️⃣ 用户输入:学习小时数
2️⃣ AI 自动判断:是否及格
3️⃣ 输出结果:
- ✅ 及格
- ❌ 不及格
4️⃣ 输出模型准确率
✅ 完整项目参考代码(你可以直接敲)
import numpy as np
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
# 构造数据
X = np.array([[1], [2], [3], [4], [5], [6]])
y = np.array([0, 0, 0, 1, 1, 1])
# 拆分数据
X_train, X_test, y_train, y_test = train_test_split(
X, y, test_size=0.3
)
# 创建模型
model = LogisticRegression()
# 训练模型
model.fit(X_train, y_train)
# 输出准确率
score = model.score(X_test, y_test)
print("模型准确率:", score)
# 用户预测
hour = float(input("请输入学习小时数:"))
pred = model.predict([[hour]])
if pred[0] == 1:
print("✅ 预测结果:及格")
else:
print("❌ 预测结果:不及格")🔥 这个程序已经是:
✅ 真实“机器学习分类系统”的最小完整模型
✅ 第 20 天练习任务(必须做)
✅ 练习 1(核心)
✅ 完成:
✅ 考试是否及格预测系统(上面的项目)
✅ 练习 2(进阶,自选一个)
你可以自己设计一个分类系统:
- ✅ 是否录取(分数 → 录取 / 未录取)
- ✅ 是否健身成功(运动天数 → 成功 / 失败)
- ✅ 是否合格产品(尺寸 → 合格 / 不合格)
要求:
- ✅ 自己构造 X, y
- ✅ 用 LogisticRegression 训练
- ✅ 用户输入 → AI 输出判断
✅ 今天你已经真正进入:
你现在已经具备:
- ✅ 机器学习【二分类建模能力】
- ✅ 真实分类模型构建流程
- ✅ 训练集 / 测试集思维
- ✅ 模型准确率评估能力
🎯 你已经超过:
✅ 90% 只会“照着课本敲代码”的大学新生层次
🚀 第 21 天预告(AI 重要升级)
当你说:
👉 “第 20 天项目跑通了”
我就带你进入:
✅ 第 21 天:决策树 & 随机森林(更强的分类 AI)
你将学会:
- ✅ 比逻辑回归更强的模型
- ✅ 能处理更复杂判断
- ✅ 真正“像 AI 一样做决策” 🌳🤖
✅ 现在你可以開始敲第 20 天的【智能分类项目】
✅ 跑通后你可以:
- 把你的代码发给我
- 把你的预测结果截图发给我(描述也行)
我可以继续带你:
👉 从【AI 入门】 → 冲到【AI 实战 + 大学竞赛级】🚀
相关推荐
- 第 16 天:常用第三方库(requests + pandas 入门) 2026-01-03
- 第 17 天:第一个完整综合项目实战 2026-01-03
- 第 18 天:NumPy + 高级 Pandas + 数据可视化入门 2026-01-03
- 第 19 天:机器学习入门(scikit-learn) 2026-01-03
- 第 14 天:OOP 进阶(继承 _ 方法重写 _ 多态) 2026-01-03
评论0
暂时没有评论