Posted 2026-01-07Updated 2026-02-17 Jaco Liu AI / tutorialan hour read (About 12349 words)

基于 Qwen 的 LoRA 微调原理以及实战：从零到一微调上线一个典型QA客服问答系统的实践流程

摘要

在2026年，大语言模型(LLMs)已经成为企业智能化转型的核心驱动力，特别是在客户服务领域。
本文将以Qwen模型为例，结合一个具体的QA问答业务场景，深入探讨如何通过LoRA(Low-Rank Adaptation)技术进行高效微调，从原理到实战，完整覆盖客服问答系统的构建流程，只是提供思路以及方向指导，具体还是要以实际业务为准⚠️，也欢迎一起交流学习。

Posted 2025-12-27Updated 2026-02-17 Jaco Liu AI / tutorial19 minutes read (About 2920 words)

基于Qwen3的MCP架构的入门：学生信息管理系统完整实现Demo为例实践指南

一、MCP架构原理概述

1.1 MCP基本概念

MCP（Model Context Protocol）是一种模型上下文协议，通过统一的协议让AI模型连接各种工具和数据源，类似于AI世界的”USB-C”接口。
该协议采用会话导向的JSON-RPC框架，使大语言模型能够与外部系统和数据源进行交互。 MCP服务器充当模型与本地环境或外部系统的桥梁，向CLI暴露工具和资源，实现AI驱动的交互。

Posted 2025-12-03Updated 2026-01-30 Jaco Liu AI / Agent39 minutes read (About 5897 words)

Discussion and analysis of Text2SQL technology, the most difficult pain point in the commercial implementation of agents.（Agent 商业落地里最难的痛点 Text2SQL 技术探讨和解析）

Agent 商业落地里最难的是 Text2SQL（NL2SQL），几乎是无法绕开的核心痛点，主要面临的三个核心问题：

为什么到目前为止仍然没有真正可靠的商业共识性企业级解决方案？
实际企业应用场景中，有哪些靠谱的思路和解决方案？

Posted 2025-12-02Updated 2026-01-30 Jaco Liu AI / Agent11 minutes read (About 1694 words)

Ultimate Guide to Quantizing AI Large Language Models: From FP32 to INT4, How to Make Large Models Perform at Full Speed on Consumer Devices?（AI 大语言模型量化终极指南：从 FP32 到 INT4，如何让大模型在消费级设备部署应用及选型？）

——深度解析量化格式、尺寸差异与硬件适配策略（附 M3 Pro 实战指南）

个人常用办公终端设备型号：

Macbook Pro M3 （36G 内存定制款)

小结：

Apple 用户闭眼选 BF16：M3 Pro 芯片的 BF16 性能碾压 FP16，18GB 内存可流畅运行 30B 级模型
⚠️ INT4 是双刃剑：70B 模型塞进 36GB 内存的唯一方案，但精度损失高达 15%+
🔮 未来属于 FP8：NVIDIA H100 已支持，苹果 M4 或成转折点

Posted 2025-12-01Updated 2026-02-17 Jaco Liu AI / Algo15 minutes read (About 2281 words)

基于 Golang 模拟实现一个简化的 DeepSeek AI 模型 GRPO 算法推理

模拟实现一个简化的 GRPO (Group Relative Policy Optimization) 推理模型。GRPO 是由 DeepSeek 提出的强化学习算法，用于训练大型语言模型

它的核心特点是不需要训练价值函数，而是通过从同一问题的多个输出中计算平均奖励来替代这一过程，显著减少了内存和计算资源的消耗。

简化版 GRPO 推理模型：

Posted 2025-10-27Updated 2026-01-30 Jaco Liu AI / Agent31 minutes read (About 4708 words)

Thoughts on Agent-based Enterprise Application Architecture.（Agent 企业级应用架构思考和挑战）

“不确定性不是缺陷，而是新范式的特征，必须学会“回忆”，但同时也要学会“遗忘”。”

AI 时代，智能体本身的概率输出让软件走向不确定，或者说更个性。但这对企业级产品的准确率形成巨大挑战，怎么看待这种现状、机遇和商业风险？智能体和传统应用范式下在业务落地间角色和职能的划分和原则?

这是目前 AI 面临的核心问题，触及了 AI 原生时代企业软件架构、产品设计与组织协作的根本性变革和创业者的产品决策方向。

Posted 2025-02-12Updated 2026-02-12 Jaco Liu AI / GPT19 minutes read (About 2888 words)

microgpt.py Andrej Karpathy (AK)源码详解GPT训练和推理艺术过程(附中文注释)

Andrej Karpathy (AK) 发布的 microgpt.py。它的伟大之处在于，除了 Python 内置的数学库，它不依赖于任何深度学习框架（如 PyTorch 或 TensorFlow），却完整实现了 GPT 的核心组件：自动求导、Transformer 架构、Adam 优化器以及推理逻辑。

Posted 2025-01-27Updated 2026-01-30 Jaco Liu AI / Agentan hour read (About 6702 words)

Thoughts on Agent-based Enterprise Application Architecture.（Agent 企业级应用Agent-skills技术原理以及架构思考和挑战）

Agent与Skill技术原理与实践：从理论到生产落地的思考心得和体会

概述：智能Agent的时代已来

在人工智能技术飞速发展的今天，Agent（智能代理）和Skill（技能模块）已成为构建下一代AI应用的核心架构。不同于传统的单一大模型调用，Agent架构通过将复杂的任务分解为多个可组合的技能模块，实现了更灵活、更可控、更专业的智能系统。

Posted 2025-01-09Updated 2026-01-30 Jaco Liu AI / Agent29 minutes read (About 4377 words)

Agent Skill技术实践：简单构建基于Qen与DeepSeek大模型的智能技能体系实践

一、Agent Skill技术概述

本文深入探讨Agent Skill技术架构，通过千问和DeepSeek大模型的实际案例，提供完整的技能实现方案，包含Python和Golang双版本代码，助你打造专业级AI智能体。

Posted 2024-02-17Updated 2026-01-30 Jaco Liu AI4 minutes read (About 609 words)

WDFT (Warped Discrete Fourier Transform)

基于 Qwen 的 LoRA 微调原理以及实战：从零到一微调上线一个典型QA客服问答系统的实践流程

摘要

基于Qwen3的MCP架构的入门：学生信息管理系统完整实现Demo为例实践指南

一、MCP架构原理概述

1.1 MCP基本概念

Discussion and analysis of Text2SQL technology, the most difficult pain point in the commercial implementation of agents.（Agent 商业落地里最难的痛点 Text2SQL 技术探讨和解析）

Agent 商业落地里最难的是 Text2SQL（NL2SQL），几乎是无法绕开的核心痛点，主要面临的三个核心问题：

Ultimate Guide to Quantizing AI Large Language Models: From FP32 to INT4, How to Make Large Models Perform at Full Speed on Consumer Devices?（AI 大语言模型量化终极指南：从 FP32 到 INT4，如何让大模型在消费级设备部署应用及选型？）

基于 Golang 模拟实现一个简化的 DeepSeek AI 模型 GRPO 算法推理

模拟实现一个简化的 GRPO (Group Relative Policy Optimization) 推理模型。GRPO 是由 DeepSeek 提出的强化学习算法，用于训练大型语言模型

简化版 GRPO 推理模型：

Thoughts on Agent-based Enterprise Application Architecture.（Agent 企业级应用架构思考和挑战）

“不确定性不是缺陷，而是新范式的特征，必须学会“回忆”，但同时也要学会“遗忘”。”

microgpt.py Andrej Karpathy (AK)源码详解GPT训练和推理艺术过程(附中文注释)

Thoughts on Agent-based Enterprise Application Architecture.（Agent 企业级应用Agent-skills技术原理以及架构思考和挑战）

Agent与Skill技术原理与实践：从理论到生产落地的思考心得和体会

概述：智能Agent的时代已来

Agent Skill技术实践：简单构建基于Qen与DeepSeek大模型的智能技能体系实践

一、Agent Skill技术概述

WDFT (Warped Discrete Fourier Transform)

WDFT (Warped Discrete Fourier Transform) by Go

Implementation of Go language:

CLUSTRMAPS

Links

Archives

Advertisement

Recents

Categories

Tags