Posted 2026-03-06Updated 2026-03-11 Jaco Liu AI / Agentan hour read (About 9634 words)

关于Agent开发的阶段性思考———从基础原理理解到高阶应用实践的谜思解构

近期在工作闲暇之余一直在反思Agent开发以及相关的方向，Agent智能体开发难吗？在行业不断制造各种概念的今天，说难也难，难在模型本身概率输出的不可控属性，说简单大道至简，一语道破的话，核心就是Prompt的架构艺术。行业造了那么多概念，其实都是围绕着上下文工程展开，开发者还是要守正出奇，多透过现象看本质，不要为了AI而AI让自己陷入拿着锤子找钉子的定式思维模式，也不要过度信任概率模型的能力。

首先记住一点，**开发者不再是”写解析器的人”，而是”设计交互协议的人”**。这种角色和思维的转变，是 Agent 开发者的核心竞争力所在，要摒弃一些旧的路径依赖思维，所谓杯满则溢，理解了这一点，很多LLM的“新东西”在理解上才会变得顺理成章。

Posted 2026-02-17Updated 2026-02-17 Jaco Liu AI / tutorial24 minutes read (About 3575 words)

RAG数据处理分类归纳实践经验总结

针对 RAG（检索增强生成）系统在实际落地中，“数据质量 > 数据数量” 是 RAG 的第一定律。

试试的/临时数据：放入 Context 或 Cache，不要放入向量库，除非它通过了”3Q 过滤”并转化为正式知识。
动态数据：结构化走 SQL，非结构化走异步队列 + 元数据状态标记，避免高频重写向量。
效率问题：靠元数据预过滤缩小搜索空间，靠混合检索 + Rerank 保证精度，靠量化索引节省内存。

RAG实践的核心在于将向量数据库视为“长期记忆库”，而非“临时缓存区”，通过分层管理平衡成本、效率与效果。

Posted 2026-02-09Updated 2026-03-05 Jaco Liu AI / Agent29 minutes read (About 4341 words)

于OpenClaw的设计原理以及技术架构解构分析以及工程实践和安全挑战(仅供参考)

OpenClaw 的价值在于将现有 AI 技术（LLM 推理 + 工具调用 + 记忆机制）以工程化方式打包成可快速部署的个人智能体平台，加速了 AI Agent 从概念到实用的转化，但其本质仍是技术整合而非范式革命。

有研究证实在同等算力下，串行精炼（sequential refinement）配合逆熵投票（inverse-entropy voting）显著优于并行自洽（parallel self-consistency），并行仅适用于真正独立的子任务，而非需要逻辑依赖的推理。
相对来说 OpenClaw虽然并未带来革命性的解决方案，但提供了一种更接近智能化的工程化实践方案，加速了基于推理和链式决策的智能化解决方案推出。

Posted 2026-01-28Updated 2026-02-17 Jaco Liu AI / Agent11 minutes read (About 1691 words)

基于 Eino 框架构建智能客服 Agent：MCP 与 Skills 的工程化实践初探

注：以下基于 CloudWeGo Eino 框架（v1.2+）最新实践，结合 设计理念深度解读 与 可视化运行流程，完整呈现企业级 Agent 构建方案。。

Posted 2026-01-25Updated 2026-01-30 Jaco Liu AI / Agentan hour read (About 8743 words)

基于 HEART 架构理念的隐私保护AI健康应用设计的一种架构思路实践解决方案

摘要

本人一直非常欣赏的一句话：

除非经由记忆之路，人不能抵达纵深。 ————汉娜·阿伦特

首先如果基于HEART架构理念，如何设计一个确保数据隐私的AI健康应用架构？相信这在2026开年的今天，以及过去一年甚嚣尘上的各种AI应用开发技术和规范原则鼓吹之下要思考和反思的问题，作为工程师要回归清醒与理智。

Posted 2026-01-25Updated 2026-02-17 Jaco Liu AI / Agent23 minutes read (About 3378 words)

Agent和RAG：双阶段意图识别以及典型场景(客服)问答场景下准确率与延迟的帕累托最优解解析

首先为什么90%的生产级Agent系统选择这一架构？🤔

以典型案例来说：在几乎所有IM客服(电商)交互式对话系统应用中，“所有请求同等对待”是最大的资源浪费。
目前业界共识之一是：双阶段意图识别通过“计算资源动态分配”思想，在96.7%准确率与98ms平均延迟间取得工程最优平衡，也几乎成为Agent系统的事实性标准架构之一。

Posted 2026-01-24Updated 2026-02-17 Jaco Liu AI / Agentan hour read (About 7189 words)

Agent 与 Skills 之间的区别通过一个简单图书馆借阅系统案例实践指南

摘要

在技术语境下，两者的关系可以简单概括和区分为：Agent 是决策中心，Skills 是执行函数。

Posted 2026-01-19Updated 2026-01-31 Jaco Liu AI / LLMan hour read (About 7510 words)

基于Go语言实现Transformer模型（包含训练、保存、加载和交互式文本生成功能）

基于Go语言实现Transformer模型，包含训练、保存、加载和交互式文本生成功能，纯CPU运行，仅依赖标准库和gonum，帮助理解大模型的运行本质原理：

Posted 2026-01-18Updated 2026-03-19 Jaco Liu AI / LLMan hour read (About 8301 words)

LLM大模型会话ID身份跟踪标识原理解构：从模型无状态下的会话ID(Session ID)原理分析以及自主实现会话跟踪

晚上和一个老同学相互交流学习到很晚，讨论持续到凌晨，关于在AI Agent应用实际开发过程中开发者都会面临的一个问题或者说是疑问：模型是无状态的也没有缓存“记忆”机制，那会话的上下文是怎么实现跟踪的呢？
带着这个疑问和思考，以下我将从设计原理到实践进行解构，帮理理解Agent开发中个最核心的问题之一。

Posted 2026-01-07Updated 2026-02-17 Jaco Liu AI / tutorialan hour read (About 12349 words)

基于 Qwen 的 LoRA 微调原理以及实战：从零到一微调上线一个典型QA客服问答系统的实践流程

摘要

在2026年，大语言模型(LLMs)已经成为企业智能化转型的核心驱动力，特别是在客户服务领域。
本文将以Qwen模型为例，结合一个具体的QA问答业务场景，深入探讨如何通过LoRA(Low-Rank Adaptation)技术进行高效微调，从原理到实战，完整覆盖客服问答系统的构建流程，只是提供思路以及方向指导，具体还是要以实际业务为准⚠️，也欢迎一起交流学习。

关于Agent开发的阶段性思考———从基础原理理解到高阶应用实践的谜思解构

RAG数据处理分类归纳实践经验总结

于OpenClaw的设计原理以及技术架构解构分析以及工程实践和安全挑战(仅供参考)

基于 Eino 框架构建智能客服 Agent：MCP 与 Skills 的工程化实践初探

基于 HEART 架构理念的隐私保护AI健康应用设计的一种架构思路实践解决方案

摘要

Agent和RAG：双阶段意图识别以及典型场景(客服)问答场景下准确率与延迟的帕累托最优解解析

首先为什么90%的生产级Agent系统选择这一架构？🤔

Agent 与 Skills 之间的区别通过一个简单图书馆借阅系统案例实践指南

摘要

基于Go语言实现Transformer模型（包含训练、保存、加载和交互式文本生成功能）

LLM大模型会话ID身份跟踪标识原理解构：从模型无状态下的会话ID(Session ID)原理分析以及自主实现会话跟踪

基于 Qwen 的 LoRA 微调原理以及实战：从零到一微调上线一个典型QA客服问答系统的实践流程

摘要

CLUSTRMAPS

Links

Archives

Advertisement

Recents

Categories

Tags