LLM

All Posts

Published on
2026年1月29日
Mem0：给 AI Agent 加上一层“可用的长期记忆”（介绍与上手）
AI Agent Memory LLM RAG
从“为什么需要长期记忆”讲起，深入浅出介绍 Mem0 的核心概念与工作流，并给出可直接跑通的 Python 示例与落地建议。
Published on
2026年1月27日
从 Ubuntu 到 vLLM：现代大模型推理部署的分层架构详解
LLM vLLM vLLM-Stack PyTorch CUDA
从工程视角拆解 Ubuntu + CUDA + PyTorch + vLLM + Python 的完整推理栈，讲清每一层干什么、数据模型长什么样、以及一次推理请求如何在各层之间流动。
Published on
2026年1月22日
LangChain 接入 MCP 示例：构建更智能的上下文感知应用
AI LangChain MCP LLM Python Tutorial
本文详细介绍了如何在 LangChain 框架中集成 Model Context Protocol (MCP)，通过具体的代码示例展示如何构建能够动态获取和使用外部上下文的智能应用。
Published on
2026年1月22日
LangChain内存管理机制深度解析：从短时对话到长时记忆的架构哲学
AI LangChain LLM Memory-Management LangGraph
本文深入剖析LangChain框架中短时内存与长时内存的设计原理、实现机制、应用场景，并结合LangGraph的持久化能力，为构建复杂、可扩展的AI代理提供最佳实践。
Published on
2026年1月14日
构建高效的 AI Agent
AI Agent Anthropic LLM
Anthropic 分享了与客户合作构建 LLM Agent 的经验，介绍了从简单可组合模式到自主 Agent 的最佳实践，包括工作流模式、构建块和实际应用案例。
Published on
2026年1月12日
大语言模型学习指南
LLM ChatGPT RAG Claude AI开发 favorites
本文提供了大语言模型（LLM）学习的全面指南，涵盖官方资源、论坛、博客、论文、开发工具、视频博主和模型下载等多个方面。重点介绍了OpenAI、Anthropic、Mistral等前沿公司，以及Reddit、Hugging Face等社区资源。新增Claude Code、MCP协议等最新开发工具，推荐多个AI教育频道，帮助读者获取2026年最新的技术和实践经验。
Published on
2025年9月10日
LangGraph最佳实践：构建可靠有状态AI代理的关键策略
AI 大模型 LLM Tools 教程 LangGraph
本文总结了LangGraph构建有状态AI代理的核心最佳实践，包括设计清晰的状态结构、强制使用检查点、利用子图模块化、合理引入人机协作及用LangSmith调试等，结合实战示例说明如何应用这些策略，帮助开发者构建可靠、可扩展的AI代理。
Published on
2025年9月10日
LangGraph入门指南：构建长期运行的有状态AI代理
AI 大模型 LLM Tools 教程
LangGraph是LangChain推出的低级别 orchestration框架，专注于构建长期运行、有状态的AI代理。本文介绍了其核心优势（持久化执行、人机协作、全面内存管理等）、快速入门例子（构建天气查询代理）、核心概念（图、状态、检查点）及生态整合，帮助开发者快速上手LangGraph。
Published on
2025年4月7日
DeepSeek Agent MCP实践
AI LLM MCP
本文介绍了如何使用DeepSeek AI模型和MCP框架构建一个多功能代理系统，包括天气查询、Shell命令执行和时间信息获取等功能的实践经验。
Published on
2025年4月2日
小型语言模型微调的适用场景
AI LLM 微调
Andrew Ng分享了他对何时应该以及何时不应该使用微调技术的见解，基于他在多家公司的观察。
Published on
2025年3月27日
DeepSeek-V3-0324 发布了啥
AI LLM
DeepSeek在2025年3月24日发布了V3-0324版本，这次更新带来了显著的性能提升。新版本在推理能力、编程能力和中文语言处理方面都有重大突破，特别是在MMLU-Pro、GPQA等基准测试中取得了优异成绩。该模型采用MIT开源许可，包含约685亿参数，并支持高达128K的上下文长度，在AI领域树立了新的标杆。
Published on
2025年3月25日
面向AI开发经验总结
AI LLM
总结在AI驱动开发过程中的经验和最佳实践，包括如何更好地利用AI助手进行开发。
Published on
2025年3月25日
掌握提示工程与功能测试：确保可靠的LLM输出
LLM AI Prompt
如何通过包含输入/输出数据集的功能测试，以系统化方法评估提示，使复杂人工智能任务的提示工程更加可靠。
Published on
2025年3月24日
LLM前沿动态追踪指南
LLM AI
本文提供了跟踪大语言模型(LLM)最新发展和趋势的全面资源导航，包括研究论文、技术博客、行业动态、社区讨论和开发工具等。帮助读者在快速发展的AI时代保持信息更新，紧跟前沿技术潮流，不错过LLM领域的关键进展。
Published on
2025年3月23日
Cursor新手教程：最佳实践指南
AI LLM Tools
这份指南提供了使用AI代码编辑器Cursor的实用技巧，帮助你更高效地构建应用程序，无论你是初学者还是有经验的开发者。
Published on
2025年3月23日
我们应该怎样使用AI编程工具
AI LLM
AI工具不仅改变了工程师的工作方式，还使更多人能够构建应用和网站。本文深入探讨了三类主要AI编程工具：通用AI聊天机器人、AI集成IDE助手和基于Web的应用生成器，分析它们的优缺点及实际应用案例，展示它们如何推动开发者生产力的新浪潮。
Published on
2025年3月19日
提示工程终极指南：从入门到精通
AI LLM
本文提供全面的提示工程指南，从基础概念到高级策略，帮助读者掌握与AI大模型有效沟通的技巧，提高对话效率和结果质量。
Published on
2025年3月19日
RAG技术实现原理
LLM RAG
本文详细解析检索增强生成(RAG)技术的工作原理、架构组成和应用场景，介绍如何结合信息检索与生成模型提升大语言模型在知识密集型任务中的表现。
Published on
2025年3月14日
大型语言模型不知道自己不知道——这是个问题
LLM
本文探讨了大型语言模型(LLMs)的一个关键缺陷：缺乏对自身能力的认知。这使得它们在执行自己并不理解的任务时过于自信，造成比幻觉问题更严重的实用性困境。
Published on
2025年2月18日
向小白解释监督学习(SFT)和强化(RL)学习
LLM
用新手快递员来举例，如何向小白解释监督学习和强化学习。
Published on
2024年5月27日
LangChain 接入 MCP 实战指南：解锁模型上下文管理新范式
LangChain MCP AI LLM Python Tutorial
本文详细介绍了如何将 LangChain 与 MCP (Model Context Protocol) 集成，通过实际代码示例展示如何高效管理大语言模型的上下文，提升应用性能与可靠性。
Published on
2024年5月22日
LangChain 接入 MCP 完整指南：解锁模型上下文管理新范式
AI LangChain MCP Python Tutorial LLM
本文详细介绍了如何在 LangChain 框架中接入 Model Context Protocol (MCP)，通过实际代码示例展示如何高效管理大语言模型的上下文，提升应用性能与可靠性。
Published on
2024年5月22日
LangChain 接入 MCP 示例：解锁模型上下文新能力
LangChain AI LLM MCP Tutorial
本文详细介绍了如何将 LangChain 与 MCP（Model Context Protocol）集成，通过实际代码示例展示如何利用 MCP 协议为 LLM 应用注入动态、结构化的上下文信息。
Published on
2024年2月26日
100行代码复现Langchain
LLM
本文通过约100行代码复现了LangChain的核心功能，展示了如何利用LLM（如GPT）和工具（如搜索引擎、计算器）构建智能对话界面。作者详细介绍了从问题解析、工具调用到结果反馈的实现过程，并探讨了其背后的提示设计与推理机制。尽管简单，该实现已能处理多轮对话和复杂查询，但也揭示了当前技术的局限性。
Published on
2024年2月24日
人工智能视频收藏
LLM favorites
本文整理了多个人工智能入门和 ChatGPT 相关的优质视频资源，涵盖从基础概念到深入原理的讲解，适合不同层次的学习者，帮助快速理解人工智能和大模型技术。
Published on
2024年2月16日
LangChain和LlamaIndex之间有什么区别？
LLM
本文比较了LangChain和LlamaIndex两个框架在构建LLM应用程序时的表现，通过四个任务：连接本地LLM、构建RAG系统、结合两者及转换为代理人，帮助读者选择适合的框架。
Published on
2024年2月16日
为什么RAG很重要
LLM
本文探讨了检索增强生成（RAG）在大型语言模型（LLM）中的重要性，解释了其如何降低成本、保持数据更新和提高透明度，并介绍了ReAct范式使LLM成为代理人的机制，推动人工智能技术的民主化。
Published on
2024年2月16日
让LLM性能飙升的Prompt黄金准则
LLM
本文介绍了穆罕默德・本・扎耶德人工智能大学 VILA Lab 的一项研究，提出了26条具体的提示工程准则，旨在提升大语言模型（LLM）的性能，无需额外训练即可提高50%以上的效果。这些准则涵盖了回答内容控制、任务分解、用户交互等多个方面，帮助用户更有效地与大模型互动并获得高质量的回答。研究引起了广泛关注，并提供了详细的指南和示例。
Published on
2024年2月15日
简单易懂的Prompt 高级技巧： Few-Shots 、 COT 、SC、TOT 、Step-Back
LLM
本文介绍了几种高级的Prompt编写技巧，包括CRISPE框架、Zero-Shot、Few-Shots、COT（思维链）、SC（自我一致性）、TOT（树状推理）和Step-Back。通过一个英文翻译成中文的任务示例，展示了不同Prompt模式对大语言模型输出结果的影响，并总结了每种模式的效果。文章还解释了Google在Gemini大模型评测中使用不同Prompt模式的原因，指出其在不同指标上采用不同的提示策略以优化表现。
Published on
2024年2月15日
RAG的7种常见问题及解决方案
LLM RAG
本文总结了RAG系统的7种常见问题及解决方案，涵盖内容幻觉、答案遗漏、整合限制等，并提供了优化策略，如元数据过滤、模型微调和知识库优化，提升系统性能。

LLM

LLM (30)