About

刘三三

做产品 / 写代码 / 爱折腾

我在做学习工具、运营产品，也在持续做一些有意思的小项目。这是我的个人主页，也像一份工作日志。最近在做什么、哪里做砸了、哪些想法真的跑通了，我都会慢慢更新在这。

对我来说，最有成就感的事，就是把复杂问题拆开，做成大家用起来顺手、愿意一直用的东西。

Focus

学习工具与内容系统

Agent / RAG / LLM 架构

产品体验与落地效率

学历

马来西亚泰莱大学

人工智能硕士

QS 前 300 ｜ ETNCC 会议论文 1 篇

西安电子科技大学

软件工程本科

学历：本科

个人技能

LLM 应用落地

Prompt Engineering、上下文缓存优化、结构化输出、流式生成、RLVR 强化、效果评估体系。

RAG 架构设计

GraphRAG、Hybrid RAG、Knowledge Map、多模态检索、引用溯源、长文档场景优化。

Agent 系统构建

多智能体协作编排、LangGraph / LangChain、状态机设计、工具调用、Feedback Loop 自迭代。

模型工程与优化

LoRA 微调、KV Cache 优化、Token Mask、FP16 推理、Docker / K8s、全链路监控与灰度。

正在折腾

近期持续打磨的项目与研究方向。

Solvely

AIO 智能教育内容生成引擎，基于知识图谱实现 Flashcard/Quiz/Study Guide 自动化生产。应用 Gemini 显式缓存 + 流式输出 + RLVR，50 页文档生成 TTFT 从 35.7s 降至 17.4s（优化 51%）。通过 Token Mask + 状态机实现多轮对话 token 使用量降低 90%，响应提速 91%。

多智能体提示词工程系统

基于多 Agent 协作的 Prompt 自动调优系统，设计 AutoFeedbackLoop 模块捕获失败 Trace 并自动反馈至提示构造流程。引入结构化扰动技术防止过拟合，结合 Agentic Design Patterns 与上下文感知状态机，确保跨模型底座的输出一致性与逻辑稳定性。

运营蜂巢 HiveMote（MVP）

Multi-Agent 社媒运营平台，通过 LangGraph 编排创意、编剧、动画师等角色 Agent，实现从内容构思到自动发布的闭环工作流。集成 ASR + OCR 实现视频内容深度分析，支持竞品高潮点识别、章节分段及脚本模板提取。获 2025 AI Agent 大赛优秀奖。

命定风水 | Hybrid RAG 穿搭助手（MVP）

融合玄学命理与个人形象分析的 Hybrid RAG 系统，通过 CV 算法识别身形肤色并建立结构化 User Knowledge Graph。设计 Reasoning-Draft-Validator 三阶段 Prompt Workflow，集成实时天气 API 与五行规则库，在多约束条件下实现动态穿搭方案生成与自动校验。

青少年心理危机干预对话机器人

基于 Qwen2 8B + LoRA 微调的心理支持系统，采用半精度（FP16）推理优化，面向青少年提供情感引导与心理干预。重点打磨对话稳定性与引导安全性，构建安全护栏机制，在关键时刻给出更稳妥的回应，避免情绪负担。

强化学习的交通信号控制（ETNCC 论文）

基于深度强化学习的智能交通信号灯控制系统，设计多智能体协作架构实现路口联动优化。采用 DQN 算法构建状态空间（车辆排队、等待时间、流量），通过奖励函数设计降低平均等待时间和车辆排队长度。在 SUMO 仿真环境中验证，相比固定时序控制，通行效率提升显著。

这两年最投入的一条线

把文档转成知识卡、练习题和学习路径，让读资料变成可执行学习。
持续打磨对话和检索链路，减少答非所问，让回答更贴近用户当下问题。
把评测、灰度和回滚做成固定流程，保证更新可控、稳定。
用 ADK 搭建多角色协作流程，专门用于提示词迭代和结果复盘。
沉淀批量实验与对照方法，降低拍脑袋调参，提升迭代效率。
把上传、执行、会话链路打通，让每次实验都能复现和沉淀。

爱好

做产品写代码爱折腾玩炉石骑行摄影旅行跑步

产品实验与个人表达

Solvely：AIO 智能教育内容生成引擎，一键将文档转化为 Flashcard、Quiz、Study Guide，让学习资料生产从数小时缩短到分钟级。
运营蜂巢 HiveMote：社媒运营全流程自动化平台，集成 AI 内容生成、智能分发、数据复盘，单个运营人员的工作效率提升 3 倍以上。
命定风水 | 智慧穿搭：融合玄学命理与形象分析的个性化穿搭助手，上传照片即可获得基于体型、肤色、天气、五行的定制化穿搭方案。
多智能体提示词工程系统：自动优化 Agent 提示词的实验平台，通过 Feedback Loop 机制实现提示词自我进化，让复杂工作流的准确率提升 40%+。
我在意的不只是功能上线，更希望产品能在真实生活里长期被用起来，真正解决用户问题。

以前做过的事

完成模型微调、推理优化和页面交互，交付可用原型。
重点放在安全和引导质量，避免给用户增加情绪负担。
设计基于深度强化学习的智能交通信号灯控制系统，采用多智能体协作架构实现路口联动优化。
在 SUMO 仿真环境中验证，相比固定时序控制，显著提升通行效率与路口吞吐量。

联系我

Email: threethreeliu@163.com

个人主页：threethreeliu.top

备案信息：冀ICP备2023030152号-1

Back to Home

刘三三

学历

最近动态

个人技能

正在折腾

这两年最投入的一条线

爱好

产品实验与个人表达

以前做过的事

联系我