About
刘三三
做产品 / 写代码 / 爱折腾
我在做学习工具、运营产品,也在持续做一些有意思的小项目。 这是我的个人主页,也像一份工作日志。最近在做什么、哪里做砸了、哪些想法真的跑通了,我都会慢慢更新在这。
对我来说,最有成就感的事,就是把复杂问题拆开,做成大家用起来顺手、愿意一直用的东西。
Focus
学历
马来西亚泰莱大学
人工智能硕士
QS 前 300 | ETNCC 会议论文 1 篇
西安电子科技大学
软件工程本科
学历:本科
最近动态
AI Agent 大赛(2025)· 最佳 B 端应用
参赛项目是运营蜂巢 HiveMote,做了从内容生成到发布复盘的完整闭环。
TraitTutor · 论文在投
做了一个人格感知教育智能体,核心是让教学策略随人而变;目前完成实验验证,正在投稿。
个人技能
LLM 应用落地
Prompt Engineering、上下文缓存优化、结构化输出、流式生成、RLVR 强化、效果评估体系。
RAG 架构设计
GraphRAG、Hybrid RAG、Knowledge Map、多模态检索、引用溯源、长文档场景优化。
Agent 系统构建
多智能体协作编排、LangGraph / LangChain、状态机设计、工具调用、Feedback Loop 自迭代。
模型工程与优化
LoRA 微调、KV Cache 优化、Token Mask、FP16 推理、Docker / K8s、全链路监控与灰度。
正在折腾
近期持续打磨的项目与研究方向。
Solvely
AIO 智能教育内容生成引擎,基于知识图谱实现 Flashcard/Quiz/Study Guide 自动化生产。应用 Gemini 显式缓存 + 流式输出 + RLVR,50 页文档生成 TTFT 从 35.7s 降至 17.4s(优化 51%)。通过 Token Mask + 状态机实现多轮对话 token 使用量降低 90%,响应提速 91%。
多智能体提示词工程系统
基于多 Agent 协作的 Prompt 自动调优系统,设计 AutoFeedbackLoop 模块捕获失败 Trace 并自动反馈至提示构造流程。引入结构化扰动技术防止过拟合,结合 Agentic Design Patterns 与上下文感知状态机,确保跨模型底座的输出一致性与逻辑稳定性。
运营蜂巢 HiveMote(MVP)
Multi-Agent 社媒运营平台,通过 LangGraph 编排创意、编剧、动画师等角色 Agent,实现从内容构思到自动发布的闭环工作流。集成 ASR + OCR 实现视频内容深度分析,支持竞品高潮点识别、章节分段及脚本模板提取。获 2025 AI Agent 大赛优秀奖。
命定风水 | Hybrid RAG 穿搭助手(MVP)
融合玄学命理与个人形象分析的 Hybrid RAG 系统,通过 CV 算法识别身形肤色并建立结构化 User Knowledge Graph。设计 Reasoning-Draft-Validator 三阶段 Prompt Workflow,集成实时天气 API 与五行规则库,在多约束条件下实现动态穿搭方案生成与自动校验。
青少年心理危机干预对话机器人
基于 Qwen2 8B + LoRA 微调的心理支持系统,采用半精度(FP16)推理优化,面向青少年提供情感引导与心理干预。重点打磨对话稳定性与引导安全性,构建安全护栏机制,在关键时刻给出更稳妥的回应,避免情绪负担。
强化学习的交通信号控制(ETNCC 论文)
基于深度强化学习的智能交通信号灯控制系统,设计多智能体协作架构实现路口联动优化。采用 DQN 算法构建状态空间(车辆排队、等待时间、流量),通过奖励函数设计降低平均等待时间和车辆排队长度。在 SUMO 仿真环境中验证,相比固定时序控制,通行效率提升显著。
这两年最投入的一条线
- 把文档转成知识卡、练习题和学习路径,让读资料变成可执行学习。
- 持续打磨对话和检索链路,减少答非所问,让回答更贴近用户当下问题。
- 把评测、灰度和回滚做成固定流程,保证更新可控、稳定。
- 用 ADK 搭建多角色协作流程,专门用于提示词迭代和结果复盘。
- 沉淀批量实验与对照方法,降低拍脑袋调参,提升迭代效率。
- 把上传、执行、会话链路打通,让每次实验都能复现和沉淀。
爱好
产品实验与个人表达
- Solvely:AIO 智能教育内容生成引擎,一键将文档转化为 Flashcard、Quiz、Study Guide,让学习资料生产从数小时缩短到分钟级。
- 运营蜂巢 HiveMote:社媒运营全流程自动化平台,集成 AI 内容生成、智能分发、数据复盘,单个运营人员的工作效率提升 3 倍以上。
- 命定风水 | 智慧穿搭:融合玄学命理与形象分析的个性化穿搭助手,上传照片即可获得基于体型、肤色、天气、五行的定制化穿搭方案。
- 多智能体提示词工程系统:自动优化 Agent 提示词的实验平台,通过 Feedback Loop 机制实现提示词自我进化,让复杂工作流的准确率提升 40%+。
- 我在意的不只是功能上线,更希望产品能在真实生活里长期被用起来,真正解决用户问题。
以前做过的事
- 完成模型微调、推理优化和页面交互,交付可用原型。
- 重点放在安全和引导质量,避免给用户增加情绪负担。
- 设计基于深度强化学习的智能交通信号灯控制系统,采用多智能体协作架构实现路口联动优化。
- 在 SUMO 仿真环境中验证,相比固定时序控制,显著提升通行效率与路口吞吐量。