关于Agent开发的阶段性思考———从基础原理理解到高阶应用实践的谜思解构

关于Agent开发的阶段性思考———从基础原理理解到高阶应用实践的谜思解构

近期在工作闲暇之余一直在反思Agent开发以及相关的方向,Agent智能体开发难吗?在行业不断制造各种概念的今天,说难也难,难在模型本身概率输出的不可控属性,说简单大道至简,一语道破的话,核心就是Prompt的架构艺术。行业造了那么多概念,其实都是围绕着上下文工程展开,开发者还是要守正出奇,多透过现象看本质,不要为了AI而AI让自己陷入拿着锤子找钉子的定式思维模式,也不要过度信任概率模型的能力

⚠️注意事项:因为是随笔,过于啰嗦,且模型和微调技术发展迭代较快,部分技术时效性上可能存在偏差,以下也只作主流方向和技术性解读。

Read more
RAG数据处理分类归纳实践经验总结

RAG数据处理分类归纳实践经验总结

针对 RAG(检索增强生成)系统在实际落地中,“数据质量 > 数据数量” 是 RAG 的第一定律。

  • 试试的/临时数据:放入 Context 或 Cache,不要放入向量库,除非它通过了”3Q 过滤”并转化为正式知识。
  • 动态数据:结构化走 SQL,非结构化走异步队列 + 元数据状态标记,避免高频重写向量。
  • 效率问题:靠元数据预过滤缩小搜索空间,靠混合检索 + Rerank 保证精度,靠量化索引节省内存。

RAG实践的核心在于将向量数据库视为“长期记忆库”,而非“临时缓存区”,通过分层管理平衡成本、效率与效果。

Read more
于OpenClaw的设计原理以及技术架构解构分析以及工程实践和安全挑战(仅供参考)

于OpenClaw的设计原理以及技术架构解构分析以及工程实践和安全挑战(仅供参考)

OpenClaw 的价值在于将现有 AI 技术(LLM 推理 + 工具调用 + 记忆机制)以工程化方式打包成可快速部署的个人智能体平台,加速了 AI Agent 从概念到实用的转化,但其本质仍是技术整合而非范式革命。

有研究证实在同等算力下,串行精炼(sequential refinement)配合逆熵投票(inverse-entropy voting)显著优于并行自洽(parallel self-consistency),并行仅适用于真正独立的子任务,而非需要逻辑依赖的推理。
相对来说 OpenClaw虽然并未带来革命性的解决方案,但提供了一种更接近智能化的工程化实践方案,加速了基于推理和链式决策的智能化解决方案推出。

Read more
基于 Eino 框架构建智能客服 Agent:MCP 与 Skills 的工程化实践初探
基于 HEART 架构理念的隐私保护AI健康应用设计的一种架构思路实践解决方案

基于 HEART 架构理念的隐私保护AI健康应用设计的一种架构思路实践解决方案

摘要

本人一直非常欣赏的一句话:

除非经由记忆之路,人不能抵达纵深。 ————汉娜·阿伦特

首先如果基于HEART架构理念,如何设计一个确保数据隐私的AI健康应用架构?相信这在2026开年的今天,以及过去一年甚嚣尘上的各种AI应用开发技术和规范原则鼓吹之下要思考和反思的问题,作为工程师要回归清醒与理智。

Read more
Agent和RAG:双阶段意图识别以及典型场景(客服)问答场景下准确率与延迟的帕累托最优解解析

Agent和RAG:双阶段意图识别以及典型场景(客服)问答场景下准确率与延迟的帕累托最优解解析

首先为什么90%的生产级Agent系统选择这一架构?🤔

以典型案例来说:在几乎所有IM客服(电商)交互式对话系统应用中,“所有请求同等对待”是最大的资源浪费
目前业界共识之一是:双阶段意图识别通过“计算资源动态分配”思想,在96.7%准确率与98ms平均延迟间取得工程最优平衡,也几乎成为Agent系统的事实性标准架构之一。

Read more
Agent 与 Skills 之间的区别通过一个简单图书馆借阅系统案例实践指南
基于Go语言实现Transformer模型(包含训练、保存、加载和交互式文本生成功能)
基于 Qwen 的 LoRA 微调原理以及实战:从零到一微调上线一个典型QA客服问答系统的实践流程

基于 Qwen 的 LoRA 微调原理以及实战:从零到一微调上线一个典型QA客服问答系统的实践流程

摘要

在2026年,大语言模型(LLMs)已经成为企业智能化转型的核心驱动力,特别是在客户服务领域。
本文将以Qwen模型为例,结合一个具体的QA问答业务场景,深入探讨如何通过LoRA(Low-Rank Adaptation)技术进行高效微调,从原理到实战,完整覆盖客服问答系统的构建流程,只是提供思路以及方向指导,具体还是要以实际业务为准⚠️,也欢迎一起交流学习。

Read more
基于Qwen3的MCP架构的入门:学生信息管理系统完整实现Demo为例实践指南

基于Qwen3的MCP架构的入门:学生信息管理系统完整实现Demo为例实践指南

一、MCP架构原理概述

1.1 MCP基本概念

MCP(Model Context Protocol)是一种模型上下文协议,通过统一的协议让AI模型连接各种工具和数据源,类似于AI世界的”USB-C”接口。
该协议采用会话导向的JSON-RPC框架,使大语言模型能够与外部系统和数据源进行交互。 MCP服务器充当模型与本地环境或外部系统的桥梁,向CLI暴露工具和资源,实现AI驱动的交互。

Read more