关于Agent开发的阶段性思考———从基础原理理解到高阶应用实践的谜思解构

关于Agent开发的阶段性思考———从基础原理理解到高阶应用实践的谜思解构

近期在工作闲暇之余一直在反思Agent开发以及相关的方向,Agent智能体开发难吗?在行业不断制造各种概念的今天,说难也难,难在模型本身概率输出的不可控属性,说简单大道至简,一语道破的话,核心就是Prompt的架构艺术。行业造了那么多概念,其实都是围绕着上下文工程展开,开发者还是要守正出奇,多透过现象看本质,不要为了AI而AI让自己陷入拿着锤子找钉子的定式思维模式,也不要过度信任概率模型的能力

⚠️注意事项:因为是随笔,过于啰嗦,且模型和微调技术发展迭代较快,部分技术时效性上可能存在偏差,以下也只作主流方向和技术性解读。

Read more
一文读懂 AI Skills:概念原理、流程、安全与典型业务场景电商实战工程化实践初探与解构

一文读懂 AI Skills:概念原理、流程、安全与典型业务场景电商实战工程化实践初探与解构

1. Skills 究竟是什么:是“提示词”还是“代码”?

先把结论说清楚:

Skills 的本质是“工程化的提示词扩展”,而不是直接执行的代码。
它通过一个标准化的目录(至少包含 SKILL.md)把:

  • 领域知识
  • 工作流程(SOP)
  • 工具调用方式
    封装起来,在需要的时候“按需注入”给大模型。

AI 技能的成熟度,不取决于模型概率有多高,而取决于我们能在多大程度上用规则去驾驭这种概率。

Read more
从 《AI智能危机》文章 到《仙剑奇侠传》哲学内核以及 AI 时代的道与情、生存与存在悖论的个人哲思
RAG数据处理分类归纳实践经验总结

RAG数据处理分类归纳实践经验总结

针对 RAG(检索增强生成)系统在实际落地中,“数据质量 > 数据数量” 是 RAG 的第一定律。

  • 试试的/临时数据:放入 Context 或 Cache,不要放入向量库,除非它通过了”3Q 过滤”并转化为正式知识。
  • 动态数据:结构化走 SQL,非结构化走异步队列 + 元数据状态标记,避免高频重写向量。
  • 效率问题:靠元数据预过滤缩小搜索空间,靠混合检索 + Rerank 保证精度,靠量化索引节省内存。

RAG实践的核心在于将向量数据库视为“长期记忆库”,而非“临时缓存区”,通过分层管理平衡成本、效率与效果。

Read more
于OpenClaw的设计原理以及技术架构解构分析以及工程实践和安全挑战(仅供参考)

于OpenClaw的设计原理以及技术架构解构分析以及工程实践和安全挑战(仅供参考)

OpenClaw 的价值在于将现有 AI 技术(LLM 推理 + 工具调用 + 记忆机制)以工程化方式打包成可快速部署的个人智能体平台,加速了 AI Agent 从概念到实用的转化,但其本质仍是技术整合而非范式革命。

有研究证实在同等算力下,串行精炼(sequential refinement)配合逆熵投票(inverse-entropy voting)显著优于并行自洽(parallel self-consistency),并行仅适用于真正独立的子任务,而非需要逻辑依赖的推理。
相对来说 OpenClaw虽然并未带来革命性的解决方案,但提供了一种更接近智能化的工程化实践方案,加速了基于推理和链式决策的智能化解决方案推出。

Read more
基于 Eino 框架构建智能客服 Agent:MCP 与 Skills 的工程化实践初探
基于 HEART 架构理念的隐私保护AI健康应用设计的一种架构思路实践解决方案

基于 HEART 架构理念的隐私保护AI健康应用设计的一种架构思路实践解决方案

摘要

本人一直非常欣赏的一句话:

除非经由记忆之路,人不能抵达纵深。 ————汉娜·阿伦特

首先如果基于HEART架构理念,如何设计一个确保数据隐私的AI健康应用架构?相信这在2026开年的今天,以及过去一年甚嚣尘上的各种AI应用开发技术和规范原则鼓吹之下要思考和反思的问题,作为工程师要回归清醒与理智。

Read more
Agent和RAG:双阶段意图识别以及典型场景(客服)问答场景下准确率与延迟的帕累托最优解解析

Agent和RAG:双阶段意图识别以及典型场景(客服)问答场景下准确率与延迟的帕累托最优解解析

首先为什么90%的生产级Agent系统选择这一架构?🤔

以典型案例来说:在几乎所有IM客服(电商)交互式对话系统应用中,“所有请求同等对待”是最大的资源浪费
目前业界共识之一是:双阶段意图识别通过“计算资源动态分配”思想,在96.7%准确率与98ms平均延迟间取得工程最优平衡,也几乎成为Agent系统的事实性标准架构之一。

Read more
Agent 与 Skills 之间的区别通过一个简单图书馆借阅系统案例实践指南
基于Go语言实现Transformer模型(包含训练、保存、加载和交互式文本生成功能)