基于 Eino 框架构建智能客服 Agent:MCP 与 Skills 的工程化实践初探
Agent和RAG:双阶段意图识别以及典型场景(客服)问答场景下准确率与延迟的帕累托最优解解析

Agent和RAG:双阶段意图识别以及典型场景(客服)问答场景下准确率与延迟的帕累托最优解解析

首先为什么90%的生产级Agent系统选择这一架构?🤔

以典型案例来说:在几乎所有IM客服(电商)交互式对话系统应用中,“所有请求同等对待”是最大的资源浪费
目前业界共识之一是:双阶段意图识别通过“计算资源动态分配”思想,在96.7%准确率与98ms平均延迟间取得工程最优平衡,也几乎成为Agent系统的事实性标准架构之一。

Read more
Agent 与 Skills 之间的区别通过一个简单图书馆借阅系统案例实践指南
基于 Qwen 的 LoRA 微调原理以及实战:从零到一微调上线一个典型QA客服问答系统的实践流程

基于 Qwen 的 LoRA 微调原理以及实战:从零到一微调上线一个典型QA客服问答系统的实践流程

摘要

在2026年,大语言模型(LLMs)已经成为企业智能化转型的核心驱动力,特别是在客户服务领域。
本文将以Qwen模型为例,结合一个具体的QA问答业务场景,深入探讨如何通过LoRA(Low-Rank Adaptation)技术进行高效微调,从原理到实战,完整覆盖客服问答系统的构建流程,只是提供思路以及方向指导,具体还是要以实际业务为准⚠️,也欢迎一起交流学习。

Read more
基于Qwen3的MCP架构的入门:学生信息管理系统完整实现Demo为例实践指南

基于Qwen3的MCP架构的入门:学生信息管理系统完整实现Demo为例实践指南

一、MCP架构原理概述

1.1 MCP基本概念

MCP(Model Context Protocol)是一种模型上下文协议,通过统一的协议让AI模型连接各种工具和数据源,类似于AI世界的”USB-C”接口。
该协议采用会话导向的JSON-RPC框架,使大语言模型能够与外部系统和数据源进行交互。 MCP服务器充当模型与本地环境或外部系统的桥梁,向CLI暴露工具和资源,实现AI驱动的交互。

Read more