NK NK技术分享
  • 首页
  • 大模型
  • 具身智能
  • 关于我

大模型技术

关于大模型架构设计、RAG系统、推理优化等技术文章

2024-06-15 大模型

企业级RAG系统架构设计与实践:从POC到生产

基于多个行业落地经验,分享RAG系统在数据准备、检索优化、LLM集成、性能调优等方面的架构设计要点,以及从概念验证到生产环境的演进路径...

阅读全文 →
2024-06-02 大模型

金融行业大模型应用:智能投顾与合规审核的落地挑战

结合金融领域实际案例,探讨大模型在智能投顾、合规文本审核等场景中的技术选型、数据隐私、可解释性等关键问题,并提出解决方案架构...

阅读全文 →
2024-05-05 大模型

大模型推理服务选型指南:vLLM、TensorRT-LLM、TGI对比

从吞吐量、延迟、易用性、硬件支持等角度,对比主流推理框架,为企业选型提供决策参考,并给出不同场景下的架构建议...

阅读全文 →
NK

NK

某AI企业解决方案架构师,专注于大模型与具身智能的行业落地。曾主导多个金融、制造领域的AI项目,擅长从需求分析到技术选型、架构设计直至交付的全流程。

分类导航

大模型技术 3 具身智能 1

© 2024 NK技术分享. All Rights Reserved.

ICP 京ICP备2026007424号