自然语言处理 | 美熙智能

大模型的N种高效部署方法：以LLama2为例

通过部署LLama2示例，比较不同LLM开源推理服务框架的优缺点。本文没介绍深度学习模型推理服务的传统库，如TorchServe，KServe或Triton Inference Server。 1. vLLM 它的吞吐量比HuggingFace Transformer （HF）高 …

JiangYuan

04/08/2023

024.7K0

自然语言处理

LLama2: 使用 FastAPI、Celery、Redis 和 Docker 构建可扩展的聊天机器人

本文介绍如何使用 Llama 2 和 FastAPI、Redis 和 Celery 构建基于大模型对话的应用程序，将介绍这些概念以及它们如何协同工作的。我们一直在使用 FastAPI 来构建我们的LLM应用，是一个用高性能 Web 框架，其异步功…

JiangYuan

30/07/2023

002.1K0

深度学习

大模型加速微调和训练，不得不掌握的方法，代码解析和应用示例

LoRA模型加速原理、peft包使用、Autocust自动混合精度、Accelerate和deepspeed加速、多GPU分布式训练等大模型加速训练和微调的方法和代码模板

meixi

06/04/2023

024.1K1

深度学习

大模型微调之P-tuning方法解析

Prefix-Tuning、P-tuning V1和 V2相关的原理和思路，并结合了大模型ChatGLM微调解析。

meixi

06/04/2023

017.0K0

默认分类

新年新气象，2023年计划单暨『程旭源的小店』开业了！

书山有路勤为径，学海无涯苦作舟！新年更有新气象，财源广进、广开财路！

meixi

07/03/2023

001.2K0

深度学习

如何搭建一个智能对话机器人？行业应用和问答技术梳理

智能对话机器人技术进展如何？存在哪些问题？如何设计一个企业对话机器人？用到哪些技术？

meixi

07/03/2023

001.7K0

默认分类

新的开始，写bug的程旭源，今天和大家见面啦！

写bug的程旭源，和大家见面啦！

meixi

18/01/2023

001.3K0

留学攻略

CMU博士收集: Advice for prospective and current PhD students

上百篇博士生存指南：从申请到毕业，手把手教学！

meixi

11/01/2023

001.1K0

留学攻略

智能留学咨询，Chatbot走进马来亚大学，一款留学对话机器人

工作之余，我开发了一款留学问答机器人，服务母校马来亚大学的学弟学妹们。提高留学申请时获取关键信息的效率。

meixi

11/01/2023

001.1K0

自然语言处理

文本摘要简述，基于Pytorch和Hugging Face Transformers构建示例，有源码

文本摘要的常见问题和解决方法概述，以及使用Hugging Face Transformers代码示例。

meixi

11/01/2023

002.3K0