AI · 大模型 · 软件架构
专注于 AI 大模型、Agent、RAG、软件架构等前沿技术的深度解析与实践分享。 内容同步更新至今日头条、微信公众号、掘金等平台,欢迎关注。
内容同步更新,欢迎在各平台关注
今日头条
AI技术深度解析
微信公众号
SmallYoung
掘金
技术文章同步更新
82
技术文章
6
技术分类
197
技术标签
持续更新中,覆盖 AI 前沿技术
LLM Wiki:用结构化编译替代 RAG 检索的个人知识库实践
受 Karpathy "LLM OS" 理念启发,本文记录了使用 llm-wiki Skill 将《西游记》全文编译为结构化知识库的完整实验,并与传统 RAG(Dify 默认设置)进行对比,探讨两种知识管理范式的本质差异与适用边界。
Karpathy LLM Wiki:用 AI 编译知识,彻底告别 RAG 重复推导
本文带你从零理解 Karpathy LLM Wiki 的核心思想、三层架构与实现方式,看清它与 RAG 的本质差异,掌握构建个人 AI 知识库的最佳实践。
Claude Code 源码解析:10 个值得借鉴的算法与设计模式
基于 2026 年 3 月泄露的 Claude Code 512,000 行 TypeScript 源码,深入解析权限级联、流式工具执行、双缓冲渲染等 10 个生产级 AI Agent 设计模式,帮助开发者构建更可靠的 Agentic 系统。
Spring Boot 3 集成 LangChain4j 实现 RAG 知识库问答
手把手带你用 Spring Boot 3 + LangChain4j-spring-boot-starter 1.x 搭建一个可运行的 RAG 知识库问答 Demo,包含完整 pom.xml、配置、核心代码与踩坑指南,30 分钟跑通本地示例。
Claude Code 上下文管理算法深度解析:7 层递进式防御体系
深入解析 Claude Code 源码中的 7 层递进式上下文防御体系,从 Tool Result Budget 到 Reactive Compact,揭示其在 Prompt Cache 稳定性、CQRS 双视图、熔断器模式等方面的工程智慧,帮你构建更健壮的 AI Agent 系统。
Claude Code 记忆系统深度分析:基于源码泄露的三层架构解密
2026年3月31日 Claude Code 源码意外泄露,暴露了其完整的三层记忆架构。本文基于 512K 行 TypeScript 源码,深入解析持久记忆、会话记忆与团队记忆的实现机制、安全设计与 KAIROS 未来方向。